El profesional de la información


Noviembre 1998

El tratamiento documental de la imagen electronica

El dicho popular de que "una imagen vale más que mil palabras" se puede trasladar al ámbito del tratamiento de la información y decir que "una imagen es más complicada de tratar que mil palabras".

De todas formas la filosofía que rige la descripción de imágenes es la misma que la de los documentos textuales: escoger términos que permitan su posterior recuperación y que respondan tanto a aspectos externos o formales como de contenido. En el caso de documentos-imagen, sea fija o en movimiento, todavía no existe un sistema y una metodología uniformes para hacerlo.

Actualmente se encuentran en el mercado diversos sistemas que pretenden dar una solución al tratamiento documental de la imagen.

Qbic (Query by Image Content), de IBM

Este sistema es capaz de realizar búsquedas por diferentes propiedades: la forma, la textura, las partes que integran la imagen...

El programa cuenta con un suplemento que facilita la recuperación del documento-imagen a través de la búsqueda de texto, cuyo resultado es la llamada "sopa de letras" que describe cada imagen. Los datos que contiene son el título, el artista, la fecha y una descripción libre de los aspectos formales y de contenido del gráfico.

En el Fine Arts Museum de San Francisco esta descripción libre ha sido hecha por expertos en arte durante sesiones de un minuto de duración de lluvia de ideas, y en ella se han eliminado los términos pertenecientes a la jerga museística. Puede utilizarse la bdd de Fine Arts en:

http://www.thinker.org/imagebase/index-2.html

La Nasa también ha elegido Qbic como sistema de recuperación de imagen.

El Ministerio francés de Cultura lo ha implementado en una colección de imágenes disponible en:

http://www.culture.fr:8099

Otro ejemplos los podemos encontrar en el The Art and Art History Qbic Project, que puede consultarse en:

http://libra.ucdavis.edu

y el Querying the Electronic Visualization Library by images:

http://visinfo.zib.de/imgdb

El programa está disponible de forma gratuita durante noventa días:

http://www.qbic.almaden.ibm.com

Incluye el indizador de imágenes y un motor que funcionan bajo AIX, Linux, Windows 95, NT y OS/2; también incluye un web front-end, APIs para insertar Qbic en otras aplicaciones o añadirle nuevas funciones de interrogación y una colección de imágenes.

Excalibur Retrieval Ware, de Excalibur

Desde principios de los años ochenta, la empresa Excalibur ostenta uno de los primeros puestos en cuanto a elaboración de programas de recuperación de información basados en el contenido. Sus productos bandera -Excalibur Retrieval System y Excalibur Visual RetrievalWare- incorporan la tecnología de redes neuronales en las funciones de búsqueda y recuperación.

Estos sistemas funcionan de forma distinta a los tradicionales, ya que, en lugar de crear un índice invertido que apunte a las diferentes entradas de la bdd, posee un Adaptative Pattern Recognition Processing (Apra), que emula el modo de aprendizaje biológico: el Apra desarrolla una noción cada vez más rica de los objetos, que analiza repetidas veces y desde distintos ángulos.

Si los objetos son palabras, la cuestión es simple: basta una comparación con los modelos ya conocidos para detectar fallos cometidos por quien ha tecleado o por el OCR. Si se trata de imágenes, los resultados no siempre serán los esperados debido a la ausencia de modelos con los que comparar.

La reciente compra de Excalibur realizada por Interpix Software Corporation y los acuerdos hechos con Yahoo han permitido extender la extensión de la búsqueda multimedia a los servidores web. Una versión de este producto está en:

http://www.interpix.com

Virage Image Search Engine, de Virage Corporation

Virage Corporation fue fundada en el año 1993 con la intención de elaborar productos para el análisis y la búsqueda de información en documentos multimedia. A pesar de no ser tan conocida como las anteriores, dispone de un motor que permite ser usado en plataformas Sun, Silicon Graphics, Windows y Macintosh, y que no depende de ningún sistema de archivos en particular ni de un mecanismo de entrada/salida ni sistema operativo en concreto.

Las funciones que ofrece este motor son las básicas de los sistemas de recuperación de información, pero lo que lo distingue es la eficiencia y la precisión en la gestión de los atributos de imagen. Los atributos principales son: la distribución del color, la estructura y la textura.

Algunas grandes empresas han implantado Virage, por ejemplo Kodac y PhotoDisc Inc.

Visage es un sistema de identificación facial. Puede verse en:

http://www.viisage.com

La recuperación de imágenes en los buscadores

Algunos buscadores disponen de una opción que permite realizar consultas de documentos en formato de tipo imagen (gif, jpg, avi...). Tal es el caso de Lycos:

http://www.lycos.com

que presenta un menú en la pantalla principal de búsqueda con el que ofrece realizar la consulta introducida en la ventana de interrogación bien en todo el web buscando páginas html que incluyan la cadena, bien restringiendo el ámbito de búsqueda a páginas web que contengan imágenes.

Cuando se limita la consulta por imagen, las palabras introducidas en la caja de interrogación se buscan en las URLs, ya que lo que se pretende es recuperar un fichero de tipo imagen, y por tanto tendrá su propia ubicación dentro del directorio de la página html.

El problema del sistema que usa Lycos es que no recupera basándose en una descripción de los documentos imagen, sino que compara la consulta del usuario con los nombres asignados a los ficheros -que no siempre corresponden a lo que representa la imagen que guardan-. Otro problema es que también contempla los nombres de los directorios en los que están contenidos, de manera que en ocasiones da como válido un fichero porque el término de búsqueda coincide con el del directorio en el que se ha guardado.

Por tanto, el sistema de búsqueda de documentos-imagen en el web por medio de buscadores no resulta demasiado útil, aunque siempre puede ser un primer punto de inicio para quienes no conozcan otro medio de recuperación de imagen o no dispongan de acceso a productos específicos.

Resumen del artículo de Boeri, Robert J.; Hensel, Martin. "Here's Waldo: Content‑Based Image Retrieval". EMedia Professional, vol. 11, no 2 (febrero 1998), p. 44.

http://www.emediapro.net/EMtocs/emtocfeb98.html

Realizado para IWE por:

Mari Carmen Marcos

mcmarcos@posta.unizar.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/noviembre/el_tratamiento_documental_de_la_imagen_electronica.html