Motor de busca

Na Galipedia, a Wikipedia en galego.

Un motor de busca é un sistema informático que procura arquivos almacenados en servidores web, un exemplo son os buscadores de internet (algúns buscan só na Web pero outros buscan ademais en News, Gopher, FTP, etc.) cando lles pedimos información sobre algún tema. As procuras fanse con palabras clave ou con árbores xerárquicas por temas; o resultado da procura é unha listaxe de direccións Web nas que se mencionan temas relacionados coas palabras clave buscadas.

Clasificación[editar | editar a fonte]

Pódense clasificar en dous:

  • Índices temáticos: Son sistemas de procura por temas ou categorías xerarquizados (aínda que tamén adoitan incluír sistemas de procura por palabras clave). Trátase de bases de datos de enderezos Web elaboradas "manualmente", é dicir, hai persoas que se encargan de asignar cada páxina web a unha categoría ou tema determinado.
  • Motores de busca: Son sistemas de procura por palabras clave. Son bases de datos que incorporan automaticamente páxinas web mediante "robots" de procura na rede.

Como operan en forma automática, os motores de busca conteñen xeralmente máis información que os directorios. Con todo, estes últimos tamén han de construírse a partir de procuras (non automatizadas) ou ben a partir de avisos dados polos creadores de páxinas (o cal pode ser moi limitativo).

Clases de buscadores[editar | editar a fonte]

Spiders[editar | editar a fonte]

A maioría de grandes buscadores internacionais que todos usamos e coñecemos son deste tipo. Requiren moitos recursos para o seu funcionamento.

  • Percorren as páxinas recompilando información sobre os contidos das páxinas. Cando buscamos unha información nos motores consultan a súa base de datos, e preséntana clasificadas pola súa relevancia.
  • Se buscamos unha palabra, por exemplo "ordenadores", nos resultados que nos ofrecerá o motor de busca aparecerán páxinas que conteñan esta palabra en algures do seu texto.
  • Se consideran que unha web é importante para o usuario tenden a rexistralas todas. Se non a consideran importante, só almacenan unha ou máis páxinas.
  • Cada certo tempo os motores revisan as webs para actualizaren os contidos da súa base de datos, polo que non é infrecuente que os resultados da procura estean desactualizados.
  • Os spiders teñen unha colección de programas simples e potentes con diferentes cometidos. Adóitanse dividir en tres partes: Os programas que exploran a rede -spiders-, os que constrúen a base de datos e o programa que explora a base de datos.
  • Se lles pagamos dannos un bonus que nos permitirá aparecer nas primeiras páxinas de resultados. Os spiders víronse obrigados a este tipo de publicidade para poder seguir ofrecendo aos usuarios o servizo de forma gratuíta.

Directorios[editar | editar a fonte]

Unha tecnoloxía barata, amplamente utilizada por gran cantidade de scripts no mercado. Non se requiren moitos recursos de informática pero si máis soporte humano e mantemento.

  • Os algoritmos son moito máis sinxelos, presentando a información sobre as webs rexistradas como unha colección de directorios. Non percorren as webs nin almacenan os seus contidos, só rexistran algúns dos datos da nosa páxina.
  • Os resultados da procura estarán determinados pola información que se forneceu ao directorio cando se rexistra a web. En cambio, a diferenza dos motores, son revisadas por operadores humanos e clasificadas segundo categorías, de forma que é máis fácil atopar webs do tema do noso interese.
  • Máis que buscar información sobre contidos da páxina, os resultados serán presentados facendo referencia aos contidos e temática da web.
  • A súa tecnoloxía é moi barata e sinxela.

Mixtos Buscador - Directorio[editar | editar a fonte]

Alén de teren características de buscadores, presentan as webs rexistradas en catálogos sobre contidos, que á súa vez se dividen en subseccións.

Multibuscadores[editar | editar a fonte]

Permite lanzar varias procuras en motores seleccionados respectando o formato orixinal dos buscadores.

FFA - Ligazóns gratuítas para todos[editar | editar a fonte]

FFA, páxina de ligazóns de balde para todos, nos que calquera pode inscribir a súa páxina durante un tempo limitado nestes pequenos directorios. As ligazóns non son permanentes.

Buscadores de Portal[editar | editar a fonte]

Buscadores específicos de sitio, aqueles que buscan información só no seu portal ou sitio web.