El profesional de la información


Julio 1996

Mejores búsquedas en web

Los sistemas localizadores de información en Internet están inmersos en una frenética carrera para tratar de sobresalir de entre los competidores, así como para aumentar la precisión de sus búsquedas, aspecto éste que todavía es su punto débil respecto del online convencional.

Tres de ellos han anunciado mejoras en sus motores de búsqueda, tanto para ganar en rapidez de actualización como en precisión y exhaustividad.

Infoseek

En junio adoptó una tecnología de Rank Xerox para crear un motor de búsqueda llamado Ultraseek que puede contestar 1.000 preguntas por segundo.

"Nuestro software de indización ya localizaba usualmente los nuevos webs y controlaba los que se sabe cambian frecuentemente", dijo Craig Forman, vicepresidente de Infoseek, "pero ahora la tecnología de Xerox nos permite actualizar la información casi instantáneamente y realizar búsquedas por la raíz de una palabra en varios idiomas. Gracias a ello los servicios de Infoseek son mucho más universales que los de nuestros rivales".

Con este nuevo sistema, una búsqueda de la palabra mouse (ratón) encuentra también mice (ratones); y en general se tienen en cuenta las conjugaciones irregulares de los verbos.

Ultraseekindiza cada una de las palabras de todos los documentos de los webs que controla. Según Infoseek puede contabilizar más de 25 millones de páginas cada semana, teledescargando sólo los cambios que detecta.

http://www.infoseek.com

WebCrawler

Este localizador, que pertenece a GNN, el proveedor de acceso a Internet que el año pasado fue comprado por America Online (AOL), ha puesto en marcha un nuevo sistema basado en el gestor de bases de datos en texto completo Personal Librarian de Personal Library Software (PLS).

Algunas de las mejoras son: más precisión, resumen "inteligente" de la información principal ofrecida por cada web, punteros (o direcciones) a webs similares y búsqueda en lenguaje natural (palabras sueltas y frases).

"Crear un localizador de web que obtenga resultados precisos es muy difícil", nos dijo Rob Wilen, director de WebCrawler. "Los webs no son como las referencias bibliográficas, sino que adoptan formas muy variadas y contenidos muy distintos. Además los webmasters (encargados del web) muestran muchas páginas deliberadamente en lugares inapropiados. Para ponerlo todavía más difícil, bastantes de nuestros usuarios preguntan cosas muy generales con sólo una o dos palabras, con lo que el ruido documental está asegurado".

"Nuestra tarea", continuó, "es tratar de que la base de datos que ofrecemos esté lo más limpia posible y facilitar la mejor tecnología para que los usuarios encuentren las páginas que probablemente les sean más pertinentes. El software PLS es muy robusto, fiable y adaptable a grandes bases de datos".

WebCrawlerpermite a los usuarios recuperar documentos según un ranking de relevancia, obtener sumarios de palabras clave y solicitar otros documentos similares a uno dado.

También ofrece un directorio de webs seleccionados y revisados por un equipo de GNN, clasificados en 14 áreas temáticas. Los webs resultado de las búsquedas de WebCrawler que figuran en GNN Select llevan una indicación especial en la lista que se facilita.

Según Wilen, WebCrawler ha indizado más de un millón de páginas ubicadas en 145.200 servidores, y recibe 3 millones de búsquedas diarias. "Pensamos que tener algunas páginas representativas de cada web es una meta mucho más realista y alcanzable que pretender tener un índice actualizado de todas sus páginas".

http://www.webcrawler.com

Yahoo!

Ha comprado la licencia de uso del directorio Four11, que contiene más de 6,5 millones de direcciones de correo electrónico, páginas web personales, números de teléfono y direcciones postales.

Los visitantes de Yahoo! pueden señalar "People Search" con el ratón para acceder a dicho directorio. Realizada una búsqueda y obtenida una dirección, para enviar un mensaje de correo-e no hay más que hacer clic sobre la misma.

http://www.yahoo.com

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1996/julio/mejores_bsquedas_en_web.html