El profesional de la información


Diciembre 1998

PLS ofrece gratuitamente sus productos

Por Ricardo Eíto Brun

Opciones de consulta:

QBE

En una búsqueda QBE (Query by Example) se indica que se quieren recuperar los documentos que sean similares a uno de los ya recuperados. La similitud entre dos documentos se obtiene a partir del número de términos que tienen en común.

FieldList

PLS permite buscar uno o varios términos en un grupo de campos. Para cada base de datos se pueden definir fieldlists -grupos de campos- que podrán utilizarse en las búsquedas como si se tratase de un único campo.

Por ejemplo, si se define el fieldlist Desc como [AUT, TIT, ABS], la búsqueda

Unix:DESC

equivaldría a la ecuación:

Unix:AUT OR Unix:TIT OR Unix:ABS

Personal Library Software, fabricante de uno de los programas ya clásicos de la edición electrónica y de la indexación en texto completo, ha decidido optar por esta forma de distribución de sus aplicaciones.

Esta empresa alcanzó un gran reconocimiento y prestigio durante la década de los ochenta. Entre sus clientes se encontraban grandes distribuidores de información electrónica como Dow Jones, Usa Today, o America OnLine (AOL), que la compró a comienzos de 1998.

Sin embargo, esta adquisición no ha supuesto una reactivación para PLS. Y AOL, consciente de que los programas de indexación textual no pueden aportar grandes beneficios, ha decidido suspender su comercialización y desarrollo.

Efectivamente, la trayectoria seguida en los dos últimos años por empresas líderes en la producción de indexadores como Verity o Fulcrum -adquirida por Pc-Docs en diciembre de 1997 tras una fuerte crisis- hacen manifiestas las dificultades que ha atravesado este sector.

La situación resulta sumamente paradójica en un momento en el que la difusión de información a través de internet y el diseño de intranets corporativas ha obligado a invertir en aplicaciones que faciliten el acceso a volúmenes crecientes de información.

Con esta operación AOL dispone de un conjunto de herramientas avanzadas de recuperación textual para uso interno, evita los problemas que podría causarle la dependencia de un fabricante de herramientas de indexación y puede utilizar PLS como herramienta de márketing.

Como prueba de esto, todas las sedes web que decidan utilizar el indexador de PLS podrán hacerlo gratuitamente, siempre que añadan un hiperenlace a la sede web de AOL.

PLS utiliza el nombre "thesaurus" para hacer referencia a un archivo ascii en el que se indican términos o combinaciones booleanas de términos equivalentes a una palabra, de forma que, al utilizarla en una ecuación de búsqueda seguida por el carácter @, será sustituida por sus equivalentes en el tesauro.

Por ejemplo, si un incluye la equivalencia:

ordenador (pc mainframe unix)

la búsqueda

mercado AND ordenador@

se ejecutaría realmente de la siguiente forma:

mercado AND (pc OR mainframe OR unix)

Productos

Se pueden descargar del web de PLS los siguientes programas:

  1. Personal Librarian 4.51,
  2. PLWeb-CD 1.0,
  3. PL-Web y
  4. CPL 6.3, conjunto de APIs (Application Program Interface) dirigido a los fabricantes de software que quieran integrar la tecnología PLS en sus aplicaciones.

Todos vienen acompañados por una completa documentación y ayuda en línea.

La licencia de uso indica que estos programas se pueden distribuir libremente y sin ningún coste junto a bases de datos o aplicaciones software, siempre que se haga explícita la utilización de componentes desarrollados por PLS.

Si bien AOL no ofrece apoyo técnico, los proveedores de información y fabricantes de software que acepten las condiciones de la licencia pueden ofrecer asistencia a los usuarios finales para facilitar el uso de los programas y distribuir la documentación original de PLS.

Personal Librarian

Disponible para Windows 3.1, Windows 95 y Macintosh, permite crear bases de datos textuales distribuidas en cd-rom o en redes de área local. El programa también incluye un software cliente para trabajar con estas bases de datos: búsqueda, visualización de registros, edición, etc.

PL indexa archivos en formato ascii, Word Perfect 5.0, 5.1 y Microsoft Word para Windows 2. La imposibilidad de trabajar con otros formatos muestra la desactualización del producto y evidencia la dificultad de mantenerlo como una alternativa válida en un entorno comercial.

Con Personal Librarian se puede estructurar la información en registros, cada uno de ellos con campos de longitud ilimitada, mediante unas marcas especiales que sólo podrán añadirse a los archivos ascii. Una base de datos puede estar formada por un número ilimitado de archivos.

Además, el programa soporta:

  1. imágenes en formato tiff (se incluye un visor para este formato),
  2. hiperenlaces,
  3. mecanismos de edición básicos (anotaciones y marcas de lectura),
  4. navegación (tablas de contenidos, secuencia de registros, etc.) y
  5. opciones de recuperación avanzadas: búsqueda simultánea en varias bases de datos, ordenación por relevancia, búsquedas booleanas restringidas a un campo o a un grupo de campos, palabras vacías, operadores de proximidad, búsquedas por concepto y unos asistentes llamados advisors.

Estos asistentes presentan al usuario una lista con términos adicionales que podrán añadirse a la ecuación de búsqueda. El programa incluye los siguientes advisors:

  1. Diccionario: muestra los términos incluidos en los documentos de la base de datos ordenados alfabéticamente junto a su frecuencia de aparición.
  2. Fuzzy: recoge términos del diccionario que se deletrean de forma similar al propuesto por el usuario. Por ejemplo, al escribir Casa este asistente propondría Tasa, Cosa, etc.
  3. Términos relacionados: lista las palabras que co-ocurren con el propuesto en la ecuación de búsqueda,
  4. Historia: muestra las búsquedas ejecutadas durante la sesión de trabajo; y
  5. Thesaurus: propone al usuario una lista de términos procedentes de un tesauro diseñado por el administrador de la base de datos.

Para cada entrada específica se indica una lista de sinónimos o un conjunto de términos unidos por operadores booleanos. En una ecuación de búsqueda se podrá indicar un término del tesauro utilizando una sintaxis especial. El sistema lo sustituirá por todas las palabras indicadas como sinónimos o por la ecuación de búsqueda equivalente.

Además de los advisors, Personal Librarian soporta la llamada búsqueda conceptual. Cuando se ejecuta una consulta de este tipo, el programa añade a la ecuación los 30 términos que co-ocurren con mayor frecuencia con los propuestos en la ecuación y la ejecuta de nuevo.

Personal Librarian incluye un módulo de administración desde el que se puede crear bases de datos, actualizarlas de forma incremental añadiendo y reemplazando registros, verificar y compactar bases de datos, crear tablas de contenidos, gestionar los índices y restringir el acceso mediante contraseñas.

En los documentos html indexados por PLWeb y PLWeb-CD se pueden incluir campos identificativos y descriptivos del documento. Los campos se escribirán entre las etiquetas que html reserva para los comentarios, por ejemplo:

<html>

<head>

<title>Resumen nota de prensa</title>

</head>

<body>

<!-- plsfield:Título -->

Estudio tasas crecimiento demográfico 1998

<!--plsfield:Fecha -->

1999-01-20

</body>

</html>

De esta forma se podrán hacer búsquedas restringidas a estos campos en colecciones de documentos html. PLWeb también reconoce las etiquetas <meta>.

PLWeb-CD

Similar a Personal Librarian, su finalidad es crear bases de datos textuales e indexar documentos que podrán ser distribuidos en cd-rom, en redes de área local e internet.

El programa permite acceder a bases de datos locales y remotas a través de internet con las mismas opciones de búsqueda que Personal Librarian (exceptuando los tesauros).

PLWeb-CD sustituye al software cliente de Personal Librarian por un conjunto de páginas html desde las que se accede a las bases de datos mediante un navegador internet, sin necesidad de tener instalado Personal Librarian. Se incluyen las páginas: de búsqueda, lista de resultados, visualización de documentos y las correspondientes a los distintos advisors que incorpora el programa.

Estas páginas son totalmente parametrizables por el administrador de la base de datos.

PLWeb-CD soporta, además de ascii, Word para Windows 2, Word Perfect 5.0 y 5.1, así como archivos html a los que se puede añadir marcas para diferenciar campos y poder realizar búsquedas cualificadas.

En el proceso de creación de una base de datos a partir de archivos html hay que realizar un proceso previo que fusionará todos los ficheros html en un único archivo.

PLS ofrece la utilidad Html-Merge para completar esta fusión. Además, es posible encriptar los documentos fuente con el programa PLCrypt.

PLWeb-CD incorpora un módulo de administración idéntico al de Personal Librarian. Las bases de datos creadas son compatibles con PLWeb-CD y viceversa.

PL-Web

Sin duda alguna, el producto más interesante es el indexador de intranets PL-Web, disponible para Windows NT y las principales plataformas Unix. Se pueden descargar las versiones 2.6 y 3.0.

La 2.6 está disponible para Windows NT, Sun Solaris 2.3, Irix 5.3, HP 9.05 y Digital Unix 3.2. La versión 3.0 sólo se encuentra para los sistemas operativos Sun Solaris 2.5 e Irix 5.3.

PLWeb Turbo indexa bases de datos ascii y documentos html y pdf, que podrán quedar disponibles a través de internet. Todos los accesos a la base de datos se gestionarán a través de un servidor web.

El programa reconoce e indexa las etiquetas <meta> de las páginas html, muestra un breve resumen para cada documento recuperado, y ofrece las principales opciones de búsqueda características de los programas PLS: advisors, búsqueda conceptual, tesauro de sinónimos, consulta QBE (Query by Example), etc.

La versión 3.0 de PLWeb incorpora un agente capaz de reconocer enlaces en documentos html y recuperar e indexar los archivos referenciados.

Desafortunadamente, el programa carece de un módulo de administración para Windows similar al de Personal Librarian o PLWeb-CD, y todas las operaciones de gestión de índices se hacen desde línea de comandos mediante programas ejecutables y scripts escritos en lenguaje Perl.

Callable Personal Librarian (CPL)

La oferta de PLS se completa con un API (Application Program Interface), dirigido a programadores en lenguaje C que quieran utilizar en sus aplicaciones la potencia de PLS. Con CPL se podrán hacer llamadas al motor de indexación y búsqueda, abrir bases de datos, recorrer sus registros, etc., desde programas externos.

Los programas pueden obtenerse en la URL:

http://www.pls.com

También está disponible la licencia de uso y distribución, y su documentación completa.

Personal Library Software. 2400 Research Boulevard, Rockville, MD 20850, EUA.

Tel. +1-301-990-11 55; fax: 963 97 38

http://www.pls.com

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/diciembre/pls_ofrece_gratuitamente_sus_productos.html