El profesional de la información


Julio 1999

Recuperacion por similaridad en la imagen electronica

Al igual que ocurre en el tratamiento de información textual, las imágenes necesitan que se les asigne una descripción adecuada que las haga accesibles para quienes realicen búsquedas sobre ellas. Sin duda, nos hallamos ante un campo menos estudiado pero al que últimamente se le viene dando cada vez más importancia.

Ya hablamos de este asunto en un número anterior (“El tratamiento documental de la imagen electrónica”, IWE, v. 7, n. 11, 1998, pp. 25-26), en el que se comentaban las distintas características de los tres programas más punteros en proceso y recuperación en bdd de imágenes fijas: Query By Image Content (Qbic) de IBM, Visual Retrieval Ware de Excalibur , y Visual Information Retrieval (VIR) de Virage Corp.

Esta vez nos ocuparemos de una forma diferente de recuperación de información, que se conoce como “búsqueda por similaridad”: dada una imagen, el programa trata de ofrecer otras que se asemejen en alguno de los aspectos indizados (color, disposición del color, forma, textura, claridad, proporciones...). Para que esto resulte satisfactorio es preciso en primer lugar que la base de datos cuente con esos campos en los que se habrá introducido previamente -a veces a mano, a veces de forma automática- la información pertinente, y en segundo lugar que el usuario determine el rasgo o los rasgos que servirán para la comparación y el nivel de similaridad que se exige en cada uno.

A partir de la imagen elegida, que aparece siempre en el ángulo superior izquierdo, se han recuperado las que más se asemejan a ella en cuanto a la textura y al contraste de luminosidad

Tres clásicos

Los programas de tratamiento y recuperación de imagen que disponen de esta técnica son de nuevo los tres nombrados anteriormente; sus páginas web ofrecen demos donde comprobar las prestaciones de cada uno.

VIR:

http://www.virage.com/products/
image_vir.html

Visual RetrievalWare:

http://www.excalib.com

Qbic:

http://www.qbic.almaden.ibm.com

«Búsqueda por similaridad: dada una imagen, el programa trata de ofrecer otras que se asemejen lo máximo posible en todos o en algunos de los aspectos indizados (color, disposición del color, forma, textura...)»

El modo de actuar de estos tres programas es muy semejante: junto a cada imagen se almacena una serie de características que la describen: los tonos de colores que lleva, la disposición de esos colores en la imagen y la textura. A estos rasgos VIR y Visual RetrievalWare añaden la forma, y éste último también la luminosidad y el aspecto.

Cuando un usuario desea obtener imágenes similares en alguno/s de los rasgos a una ya recuperada, debe indicar qué aspectos se deben tener en cuenta: en el caso de VIR y Visual RetrievalWare fijar un nivel de coincidencia entre 0 y 10 para el primero, y entre 0 y 5 para el segundo (figura 1). Por ejemplo, partiendo de la bandera de España se puede pedir que recupere todas aquellas imágenes que compartan los mismos colores (rojo y amarillo), o bien que coincidan en la forma (rectángulo apaisado con tres franjas horizontales), o bien en la disposición de los colores (parte central en amarillo y resto en rojo).

«Una empresa puede descubrir fácilmente si alguna otra entidad está utilizando una imagen muy similar a la suya»

Al margen de este modo de recuperar, cada imagen puede haber sido descrita con texto (descriptores de contenido), lo cual no podrá hacerse de forma automática como ocurre en las descripciones anteriores, sino que precisará de una persona que exprese con palabras lo que representa la imagen.

Aplicaciones de utilidad

Además del uso tradicional de este tipo de programas en museos virtuales y colecciones de imágenes, donde resultan de una utilidad

«Ante una radiografía de un paciente resultaría útil disponer de otras similares para conocer cómo se procedió en situaciones patológicas parecidas»

obvia, esta nueva técnica de comparación está dando buenos resultados en el mundo del diseño de imagen de empresa (marcas, logotipos...). Por medio de ellos una empresa puede descubrir fácilmente si alguna otra entidad está utilizando una imagen muy similar a la suya, así como crear nuevos logotipos que no coincidan con los ya existentes. Hasta hace poco tiempo la única manera de localizar esta información era acudiendo a la oficina de patentes y marcas y recorrer su base de datos donde cada logo tiene asignado un código y una descripción textual, algo muy poco consistente. Ahora IBM , tras el éxito de su sistema de búsqueda de patentes de EUA en el web de forma gratuita (v. IWE, v. 6, n. 4, p. 9) intenta hacer algo parecido con las marcas; por el momento ha desarrollado un prototipo con alrededor de mil imágenes que da un buen resultado en la búsqueda de formas similares.

Otras aplicaciones de este modo de recuperación son las que se podrían llevar a cabo en el ámbito de la medicina: ante una radiografía de un paciente resultaría útil disponer de otras similares para conocer cómo se procedió en situaciones patológicas parecidas. O incluso en el ámbito policial para localizar los datos de un sospechoso en una bdd a partir de su fotografía (o imagen de videocámara).

 

Resumen del artículo de Jacsó, P. “Searching for images by similarity online”. Online, 1998 (nov.-dec.), pp. 99-104.

Realizado por Mari-Carmen Marcos

mcmarcos ARROBA posta.unizar.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1999/julio/recuperacion_por_similaridad_en_la_imagen_electronica.html