Estratexia de busca

Na Galipedia, a Wikipedia en galego.

Unha busca faise a partir dunha cadea de texto, que se introduce na caixa de buscas dun motor de busca en Internet. Idealmente, a cadea de texto está composta polas palabras claves que representan a necesidade de información do usuario. A cadea de texto pode conter ou non operadores lóxicos ou palabras clave para obter diferentes resultados segundo o buscador empregado.

Estratexia inicial[editar | editar a fonte]

As estratexias máis básicas consisten en pescudar unha información en base ás palabras que se espera que conteñan. Normalmente se pode supoñer que a descrición do que se busca apareza no propio texto buscado e polo tanto para buscar un texto sobre xenética se pode escribir directamente xenética.

Porén, se se busca información sobre xenética de poboacións a busca coa cadea xenética de poboacións fornece datos sobre xenética, sobre de e sobre poboacións debido a que se opera co operador lóxico por omisión: a intersección. Así, atoparánse páxinas que conteñan as tres cadeas á vez ou algunha delas. Moitas veces isto ofrece datos que non interesan, por exemplo que falen das poboacións de Madagascar dende unha perspectiva distinta da xenética: antropolóxica, demográfica, xeográfica, lingüística etc.

Un problema que os propios motores de busca adoitan evitar é a busca de cadeas gramaticais sen significado léxico: é o exemplo de de, debido á súa alta frecuencia en tódolos textos. Isto acontece con demostrativos, artigos, conxuncións, preposicións e pronomes.

Superar os primeiros problemas[editar | editar a fonte]

Unha alternativa para non atopar páxinas non desexadas é usar a cadea como un todo incluíndo os seus espazos. Neste caso, o texto de busca escríbese codificado dalgún xeito, habitualmente entre comiñas: "xenética de poboacións".

Mesmo así poden aparecer unha cantidade inxente de resultados. A solución pode pasar polo uso dos devanditos operadores lóxicos distintos da interxección: o máis habitual é a disxunción. Con este mecanismo podemos especificar que o resultado conteña unha cadea e ó mesmo tempo non conteña outra: "xenética" e mais "poboacións" e non "antropoloxía".

Nas linguas derivativas ou flexivas como as linguas indoeuropeas, as variantes poden producir problemas: poboacións, poboar, poboado, populoso, popular, poboadas, poboando ou poboou etc. pode estar dentro do noso interese e non ser abranguibles nunha soa busca. A opción neste caso consiste en buscar outras verbas moito máis definitorias do que interesa atopar. Nesta situación hai que razoar semanticamente e ser imaxinativos para utilizar unha palabra chave que "obrigue" ó texto resultado a orientarse nun camiño determinado: tribo ou etnia serían bos exemplos para engadir a xenética para que fale de poboacións.

Unha estratexia máis depende das competencias lingüísticas noutras linguas. Dado que máis do 50% das páxinas e da información científica están en inglés, existe a opción se se sabe esta lingua de buscar o texto traducido ó inglés: os resultados serán máis, e maior a probabilidade de atopar algo que sirva. Isto sempre depende do espallamento do tema, pois é máis probable atopar algo sobre o galego en galego ca en inglés, e depende tamén das posibilidades de expansión dese tema polos falantes da lingua local (non é moi probable atopar algo en Internet nunha lingua cuxa poboación non accedeu nin sequera ó teléfono, que inda son moitas[quen?]).[Cómpre referencia]