Febrero 1994
Consideraciones sobre los tesauros
Por Domènec Turuguet
El tesauro es una de las herramientas
más útiles de la Documentación. En el
período que siguió a su aparición en el siglo
pasado, y luego sobre todo, con la documentación moderna,
fue considerado como indispensable para el tratamiento
idóneo de la información. Sin embargo, con el
advenimiento de la informatización y las bases de datos
documentales consultables por texto libre, pasó a un segundo
término. Ahora su uso se ha revitalizado nuevamente, y se
considera imprescindible para un tratamiento correcto de las bases
documentales.
El origen de la palabra tesauro hay que buscarlo en el mundo clásico latino y griego, donde tesauro era sinónimo de diccionario o tesoro de una determinada lengua. Ya en épocas más recientes (s. XVI), se tiene constancia del Thesaurus puerilis, de Onofre Pou, en catalán.
Pero, más acorde con el significado actual, el vocablo se deriva del Thesaurus de Peter Mark Roget, médico inglés que en 1805, cuando tenía 26 años, concibió para su uso particular un catálogo clasificado de palabras. No fue, sin embargo, hasta 1852, a la edad de 73 años, que publica por primera vez el Roget's Thesaurus, del cual por lo menos se ha hecho una treintena de ediciones.
La base del Roget es una clasificación
en 6 grandes categorías, divididas a su vez en
subcategorías:
Si bien los actuales tesauros científicos y técnicos no parece hayan seguido demasiado esta división conceptual, es conveniente tenerla presente y no olvidar cuál es el fundamento de cualquier tesauro, por pragmático que éste quiera ser. El pragmatismo no ha de hallarse reñido con el rigor conceptual; al contrario, un cierto rigor es el mejor aliado del pragmatismo.
Tampoco habría que olvidar, por su gran utilidad como ideas matrices para la indización de cualquier colección documental monotemática, las cinco categorías de Ranganathan : personalidad, materia, energía, espacio y tiempo, que guardan un cierto parecido con las de Roget.
Tipos de relaciones entre los términos
Una definición del lenguaje documental que conocemos como tesauro, es la siguiente:
Vocabulario controlado de términos, tanto alfabéticos como numéricos o alfanuméricos, con relaciones jerárquicas y asociativas entre ellos, el cual contiene tanto los términos aceptados (descriptores) como aquellos que remiten a los aceptados, con indicación del alcance de uso de cada uno de los términos aceptados y, en general, con un esquema clasificatorio amplio, dentro del cual pueden adscribirse todos los términos aceptados.
También debería formar parte de la definición el que el vocabulario se refiere a un campo concreto o específico de la ciencia o de la técnica.
Las relaciones entre los distintos términos del tesauro
son, fundamentalmente, de los siguientes tipos:
El significado exacto de los términos de un tesauro se delimita mediante notas explicativas, de acotación o de alcance ("scope notes" en inglés).
Otra característica del tesauro es la polijerarquía : a un término dado se asignan varios términos más amplios según distintos puntos de vista, que pueden aumentarse a medida que crece la colección documental a la cual se aplica el tesauro dado.
Tesauro no, tesauro sí, qué tesauro
Han aparecido distintas versiones de "tesauros", desde una simple lista de términos preferentes sin interconexión entre ellos, hasta listas exhaustivas de términos con relaciones a distintos niveles de complejidad y una rígida normativa de aplicación. Estos últimos no cumplen o cumplen mal el principal espíritu tesaurístico de flexibilidad que ha de permitir la realización de búsquedas creativas.
Mi opinión es que un tesauro no ha de ser un simple vocabulario controlado, pero tampoco una red de encorsetamiento que impida la creatividad del indizador o recuperador de la información que se almacena.
En mi ya larga singladura dentro del mundo de la información y la documentación, he encontrado tanto acérrimos enemigos como defensores a ultranza de los tesauros. Creo que su bondad o maldad no se halla en sí mismos, sino más bien en su adecuación o no a una colección documental dada. Esta adecuación depende de muchos factores: tamaño de la colección, uso de la misma, posibilidades de informatización, posibilidades económicas, proyectos de unirla a otras colecciones documentales ya existentes, etc.
Antes de emprender la elaboración de un tesauro es conveniente realizar un análisis costo-eficacia. Aparte de lo comentado anteriormente, una de las cuestiones que siempre se plantea, es la de si hay que aprovechar un tesauro preexistente o es mejor crear uno nuevo. La contestación no es sencilla, ya que intervienen múltiples variables, entre las cuales se encuentra la de que esté en una lengua extranjera, probablemente en inglés. Las traducciones crean problemas adicionales: a menudo un término del tesauro original da lugar a dos o más traducidos, es difícil tener equivalencias perfectas y quizá algunos términos sean intraducibles. Como solución provisional puede usarse el tesauro original, especialmente si se trata de materias científicas y técnicas, pero en temas humanísticos (sociología, arte, literatura, etc.) la dificultad resulta notoria. Sin embargo, la existencia de un tesauro temáticamente afín al que se pretende elaborar siempre es una buena ayuda.
Tesauro previo o hecho sobre la marcha
Otra cuestión crucial es si el tesauro ha de ser construido a priori o a posteriori, esto es, si se incluyen todos los términos que teóricamente deberían formar el campo temático cubierto, o bien, sólo los que corresponden a los documentos reales que forman la colección documental. Mi parecer se inclina por una aproximación a posteriori, pues para los usuarios resulta decepcionante encontrar términos para los cuales no hay documento alguno. Si el tesauro se halla bien estructurado, la adición de nuevos términos con las correspondientes relaciones, a los ya existentes no ha de representar mayor problema.
Fases de implementación
A tenor de lo comentado hasta ahora, las etapas para la
elaboración de un tesauro a partir del momento en que se
considera conveniente su construcción (resultado de haber
contestado afirmativamente a cuestiones previas tales como
disposición de la suficiente dotación
económica, suficiente volumen de la colección
documental y suficientes recursos humanos e informáticos
para invertirlos en la operación) serán:
Como punto final, insistir en que sólo hay que elaborar un tesauro cuando sea estrictamente necesario y según criterios de costo-eficacia. Y en caso de decidir emprender esta tarea, tener en cuenta, sobre todo, la coherencia semántica y gramatical y la aplicación de las normativas existentes.
Domènec Turuguet ha sido director del Centro de Documentación del Instituto de Higiene y Seguridad en el Trabajo del Mº de Trabajo, y director del Servicio de Documentación del Centro de Investigación y Desarrollo del Csic, ambos en Barcelona. Actualmente es consultor privado.
Tel.: +34-3-203 32 52
Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1994/febrero/consideraciones_sobre_los_tesauros.html