El profesional de la información


Julio 1997

Motores de busqueda

José Raúl VaqueroRobots, spiders, search engines, agents, webwanderers, webcrawlers, rastreadores, motores de búsqueda, buscadores, índices, directorios, etc., son todos ellos términos que muchas veces, y de forma arbitraria, se suelen usar como sinónimos que designan una potente herramienta de internet que nos permite recuperar una información concreta de entre los millones de páginas web existentes.

El presente artículo tiene como objeto romper una lanza a favor de la normalización terminológica, basada en mi experiencia como investigador y estudioso del tema, aunque, lógicamente, siempre abierto a sugerencias y modificaciones futuras.

Aclaraciones

Partiendo del principio de que un motor de búsqueda es una herramienta web que localiza de forma rápida información existente en internet y que está formado por tres elementos bien diferenciados: un interface, un robot y una base de datos, hemos de acudir a los Estados Unidos de América, pioneros en casi todos los fenómenos internet, para ver qué uso terminológico están haciendo, ya que es en este país donde probablemente tengan más claras las definiciones sobre motores.

Conciben un robot como un programa de ordenador (software) que está diseñado para recorrer de forma automática la estructura hipertexto de la web con el fin fundamental de crear automáticamente bases de datos textuales a partir de los documentos html distribuidos por los distintos servidores. El problema les surge a la hora de definir el motor, como concepto general que engloba a los tres elementos antes citados, y el interface al cual acude y plantea su pregunta el usuario.

El término más aceptado para definir el motor como concepto general es el de search engine, aunque hay otro término, agent, que podría considerarse sinónimo del anterior pero que, en general, es más usado para motores personales, es decir, programas, generalmente shareware, que cada uno se puede bajar de la red y montar en su propia máquina utilizándolo para recorrer la web cuando no se está usando el ordenador y la red está menos saturada (generalmente en horario nocturno) con el fin de bajarse direcciones relacionadas con los términos introducidos y que definen sus necesidades de información.

Situación en España

Si en Estados Unidos lo tienen más o menos claro, en España el caos parece total, aunque poco a poco se van viendo artículos y páginas web que utilizan correctamente los distintos conceptos.

En general, los términos más utilizados son los de motores de búsqueda, buscadores, rastreadores y robots. Robot, en principio, tampoco plantea ya ninguna duda y se utiliza con la misma significación que en Estados Unidos. Son los otros tres términos los que presentan variedades que al no existir un acuerdo hacen que cada uno use aquel que le resulta más sencillo o familiar.

Motor de búsqueda (por el cual yo me inclino) es una traducción libre del americano search engine, pero como los españoles somos amigos de la simplicidad, actualmente está teniendo mucha aceptación el término buscadores, forma abreviada de motores de búsqueda. En cuanto a rastreadores se me escapa su origen y causa de uso, aunque por lo general es menos utilizado que los dos anteriores.

Y por si todo este lío no fuera suficiente, existen otras dos palabras que se usan como sinónimos de motores de búsqueda: índices y directorios.

En principio, su diferencia con un motor de búsqueda parece clara. Un índice o directorio es una página u hoja web en donde, bajo un árbol de materias, se encuentran organizadas las distintas hojas existentes en la red. Pero esta definición que parece tan clara no lo es a veces tanto, ya que nos encontramos con índices (ej.: Yahoo) que presentan el mismo interface que los motores, esto es, tienen campos en los cuales se introducen los términos por los que se desea realizar la búsqueda, o motores que tienen también la posibilidad de realizar búsquedas a través de directorios.

Como se ve, la diferencia no parece tan sencilla, y las fronteras entre unos y otros son difusas. Pero de forma general podríamos decir que los índices o directorios se caracterizan por que las direcciones que tienen son recopiladas, organizadas y clasificadas manualmente, generalmente por universitarios que se dedican a esta actividad, mientras que un motor se caracteriza por tener un robot que recorre automáticamente la web indizando y recopilando información de las páginas visitadas.

El interface que se presenta al usuario, como se ha visto, puede ser igual para unos que para otros, por lo que diferenciarlos sólo es posible si se lee algún fichero de información de la herramienta o si se escribe un mail al responsable del mismo, aunque a efectos prácticos de búsqueda suele dar lo mismo.

Conclusiones

Hoy por hoy, no existe una normalización en los términos que identifican a estas herramientas de recuperación en internet, pero poco a poco se van aclarando conceptos:

* Robot: software que recorre automáticamente internet recopilando y procesando información.

* Motor de búsqueda / Buscador: términos sinónimos que identifican a la herramienta como concepto general (estaremos atentos para ver cuál se decanta como favorito).

* Índice / Directorio: hoja web donde de forma manual se organizan jerárquicamente las distintas páginas recopiladas, también manualmente, de la web.

José Raúl Vaquero
Tel.: 929-28 78 16
rvaquero ARROBA gugu.usal.es
rvaquero ARROBA ftdaula0.usal.es
http://exlibris.usal.es/~rvaquero/robot.htm

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1997/julio/motores_de_busqueda.html