El profesional de la información


Mayo 1999

Gestión y tratamiento de la información documental: una propuesta sobre límites y propiedades

Por Lluís Codina

Resumen: Propuesta de un modelo conceptual para interpretar el alcance y los límites de la información documental y, por extensión, de la Documentación como disciplina, que tiene implicaciones tanto para el estudio de esa disciplina como para su desarrollo profesional. Es central en este modelo la diferencia entre información cognitiva e información administrativa, así como destacar la naturaleza probabilista de la primera y el hecho de que la documentación tiene su núcleo de especialidad en el tratamiento de la información registrada.

Palabras clave: Ciencias de la documentación, Sistemas de información documental, Documentos cognitivos, Documentos administrativos, Sistemas probabilistas, Sistemas de gestión documental, Sistemas de gestión de bases de datos.

Title: Management and processing of cognitive information: a proposal regarding limits and properties

Abstract: A conceptual model is proposed to interpret the extension and the limits of documental (cognitive) information that has implications for Information Science both as a discipline and as a professional activity. Central to this model is the distinction between cognitive information and administrative information, as well as an emphasis on the probabilistic nature of cognitive information and on the fact that Information Science has its nucleus of specialty in the processing of recorded information.

Keywords: Library and Information Science, Information retrieval systems, Cognitive documents, Administrative Documents, Probabilistic systems, Document management systems, Database management systems.

Lluis CodinaHay dos momentos distintos para hacer avanzar las ciencias, o por lo menos para intentarlo. Uno consiste en relacionar cosas aparentemente desconectadas y es, por tanto, un movimiento de ampliación.

Se hace progresar la ciencia de esa manera, por ejemplo, cuando un autor como Herbert A. Simon2, conocido como el “padre” de la inteligencia artificial, relaciona la teoría económica de la toma de decisiones con teorías procedentes de las ciencias de la computación, y se produce así el nacimiento de la inteligencia artificial.

Ha habido otras muchas fases gloriosas en estos movimientos de ampliación. Por ejemplo cuando la unión de la lógica simbólica, la estadística y los estudios del lenguaje dieron lugar, de la mano de autores como Gerard Salton y C. J. van Rijsbergen, al paradigma actual de la recuperación de información. Un paradigma que, basándose en la explotación exhaustiva de las propiedades de los documentos, rompió así el molde secular de los sistemas de clasificación en los que se había movido nuestra disciplina desde sus inicios (y según qué consideremos como inicios, podemos retraerlos a la Edad Media, con las primeras bibliotecas universitarias).

Es decir, durante siglos, organizar una colección de documentos consistió exclusivamente en desarrollar un sistema de clasificación jerárquico en el que hubiera un lugar para cada documento y en el que cada documento tuviera su lugar.

Esto respondía, sin duda, al viejo sueño, por lo menos de origen medieval, de alcanzar un lenguaje universal, unívoco e inequívoco que trajera la paz a la humanidad.

La idea era la siguiente: la humanidad está en conflicto permanente, hay peleas y guerras entre distintas comunidades por disputas irresolubles y por conflictos reales o imaginarios. Tal vez, si dispusiéramos de un lenguaje unívoco, un lenguaje en el que fuera imposible expresar las cosas con doblez, se podría decidir cualquier disputa; sería posible saber, sin ninguna ambigüedad, quién sostiene proposiciones verdaderas y quiénes sostienen proposiciones falsas. Entonces, no es que no se pudiera mentir, sino que se sabría, y con un acuerdo universal, quién dice la verdad y quién miente.

¿Acabaría eso con toda la violencia y todas las guerras que ha padecido la humanidad, al parecer desde el primer momento de su existencia? La esperanza de quienes trabajaban en esos lenguajes era justamente esa: que habría de servir para acabar con todas las guerras, o por lo menos para poder distinguir al agresor de la víctima, al culpable del inocente...

¿Se ha conseguido ese sueño de un lenguaje universal, inequívoco y unívoco? Salta a la vista que no, pero su búsqueda nos dio algo muy elegante y muy bello, como es el álgebra de Boole, a la que tanto debemos los documentalistas.

«Los periodistas y los informáticos, cuyas habilidades profesionales apenas tienen que ver entre sí, se consideran por igual profesionales de la información con no menos justificación que los documentalistas»

Lo que buscaba Georges Boole (1815-1864) era una forma de realizar operaciones lógicas utilizando el lenguaje con la misma seguridad con la que hacemos operaciones aritméticas usando números. No consiguió exactamente lo que buscaba, y dicen sus biógrafos que murió sintiéndose fracasado, pero ahora sabemos que su álgebra se utiliza para buscar documentos y hacer más cercano otro sueño sublime, el del acceso universal a la información; y además se utiliza para diseñar ordenadores o para construir sistemas expertos.

Reducciones

Pero también se avanza en ciencia realizando reducciones. Nuestro ejemplo preferido en esta clase de movimientos es la operación de reducción que realizó Ferdinand de Saussure (1857-1913) para fundar la ciencia del lenguaje. Una reducción tan afortunada que podemos decir que la lingüística actual sigue basándose en buena parte de los postulados reduccionistas que presentó Saussure.

La cuestión es que Saussure ha pasado a la historia de la ciencia por una aportación que consistió en marcar, con una claridad que nadie había conseguido hasta entonces, cuáles eran los límites de la ciencia del lenguaje, y fundó así una ciencia y un programa de investigación que ha durado durante todo lo que llevamos de siglo. Así, en este doble movimiento que consiste en ir unas veces de la ampliación a la reducción y otras al contrario, es como parece que se va fraguando la ciencia.

Nuestro objeto de estudio

Se ha discutido el tema de la ampliación y la reducción porque existe un prejuicio en general contra el reduccionismo y, como aquí se pretende proponer ahora una operación de reducción, queríamos mostrar que esa clase de operaciones tiene antecedentes por lo menos tan ilustres como las operaciones de ampliación.

Si queremos avanzar en nuestra profesión necesitamos un modelo claro que nos diga qué estamos haciendo, o de qué clase de información se supone que nos ocupamos, pues es evidente que muchos profesionales con especialidades en realidad bien distintas se consideran por igual profesionales de la información.

Como diría Mario Bunge, todos tenemos una filosofía implícita que guía o que extravía nuestro trabajo, así que más vale hacerla explícita, y esto equivale aquí a examinar qué modelo conceptual somos capaces de crear sobre nuestra especialidad, y qué hace que sea netamente diferente de otras especialidades relacionadas con la información.

Por ejemplo, los periodistas y los informáticos, cuyas habilidades profesionales apenas tienen que ver entre sí, se consideran por igual profesionales de la información con no menos justificación que los documentalistas.

«Todas las estrategias de gestión de información cognitiva basadas exclusivamente en asignaciones unívocas de documentos a clases o subclases están destinadas a ser muy ineficientes»

Para peor, semióticos, comunicólogos y contables pueden reivindicar que ellos también son trabajadores de la información. ¿Dónde situamos pues nuestra especialidad y nuestra especificidad como documentalistas?

Entendemos que hay tres rasgos que definen cuáles son el objeto de estudio y de trabajo de la Documentación.

Determinista versus probabilista

En primer lugar, los documentalistas nos ocupamos de información cognitiva y no, por ejemplo, de información administrativa. La información cognitiva está formada por el conjunto de datos, saberes y conocimientos que genera la humanidad y que se hacen públicos a través de publicaciones tan diversas como libros, revistas, informes, tesis doctorales, ensayos, etc.

En cambio, la información administrativa es la que producen los organismos como consecuencia del mero hecho de su existencia.

Es importante detenerse un momento en la diferencia señalada. Vemos que la información administrativa surge, por decirlo en terminología archivística, de manera espontánea. Es decir, no se requiere ninguna voluntad específica para que organismos de cualquier índole generen información administrativa. Como sabe todo buen archivero, las empresas generan y reciben documentos administrativos por el mero hecho de su existencia, tanto como consecuencia de la administración de los recursos propios como a causa de su actividad específica.

Además, como hemos señalado antes, la información administrativa solamente interesa a los administradores o empleados de cada organismo concreto y a nadie más (descartamos aquí intereses espúreos, por ejemplo, como consecuencia de espionaje industrial; o situaciones anómalas, como empresas sometidas a investigaciones judiciales).

Su ciclo de vida suele ser corto, por lo menos en cuanto a patrimonio científico y cultural. En general, un documento administrativo deja de poseer valor inmediatamente después que se ha cerrado el expediente o ha finalizado el acto administrativo del que forma parte. Es cierto que habrá que conservarlo durante un número de años, principalmente por razones fiscales, e incluso que algunos deben conservarse de modo indefinido, pero esa conservación no responde a necesidades de consulta en el sentido en que se conservan libros y artículos de revista, sino para la eventualidad de una comprobación, una reclamación, una auditoria, etc. Es decir, el destino habitual de la inmensa mayoría de los documentos administrativos es no volver a ser consultados una vez creados.

SearchbankNaturalmente, cuando algunos de estos documentos administrativos han superado las barreras del expurgo y devienen históricos, adquieren otro valor, el histórico, susceptible entonces de interesar a nuevos colectivos de usuarios, pero aun así siempre tendrán un interés limitado a colectivos muy concretos y reducidos.

Por último, los documentos administrativos suelen ser unidimensionales, por lo que no suele tener ningún sentido su procesamiento documental individual, sino que son gestionados en el seno de series, que es la unidad interesante y significativa en gestión de información administrativa. Para referirnos a todo ese conjunto de propiedades decimos que la información administrativa es determinista.

Los documentos cognitivos poseen propiedades especulares respecto a los administrativos, es decir, diametralmente opuestas. Para crear un fondo compuesto por documentos cognitivos debe hacerse un esfuerzo intelectual. No se crean los fondos documentales que nutren a los centros de documentación o a las bibliotecas de forma precisamente espontánea.

Los documentos cognitivos se crean para ser publicados, y no para los ojos de los administradores de una corporación, y son susceptibles de interesar a colectivos sociales muy amplios, a toda la humanidad e incluso a distintas generaciones a lo largo de la historia, como sucede con las mejores obras de cada especialidad del conocimiento. La razón es que son documentos que reflejan creaciones del espíritu humano, en lugar de contener, por ejemplo, series de datos sobre una actividad privada (las operaciones comerciales de una empresa, por ejemplo).

Por otro lado, los documentos cognitivos raramente son unidimensionales. Ningún artículo de revista, capítulo de libro o ensayo puede ser caracterizado adecuadamente por una sola de sus propiedades, ni siquiera por propiedades como su título o su autor.

Para caracterizar a los documentos cognitivos se requieren combinaciones de un elevado número de propiedades, entre ellas su título y su responsable intelectual, como ya hemos señalado, pero también la lengua del documento, la filiación del autor, la fecha de creación, los n temas del documento, etc., sin que sea nunca posible estar seguros por cuáles de esas combinaciones podrá ser solicitado o ser necesario algún día el documento. Para referirnos a todo ese conjunto de cualidades decimos que la información cognitiva es probabilista.

En segundo lugar, los documentalistas nos ocupamos de información registrada o, si se quiere, de información que no necesariamente transcurre en tiempo real, como la que tiene lugar cuando se asiste a una conferencia, sino de información que ha sido registrada en algún soporte material y que ha pasado a formar parte de la memoria social de algún colectivo de usuarios o de la memoria social de la humanidad en su conjunto.

Fuentes interesantes versus triviales

En tercer lugar, nosotros nos ocupamos de fuentes de información no triviales, es decir, atendemos a estas fuentes de información que superan un umbral o una masa crítica de valor, de manera que su dimensión cuantitativa, cuando supera cierto umbral, deviene cualitativa. Dice la historia que en los momentos más oscuros de la Edad Media, un hombre se consideraba culto si poseía una decena de libros. Para una biblioteca de esa dimensión no se requerían documentalistas...

Por otro lado, aunque lo políticamente correcto sea decir lo contrario, lo cierto es que el tamaño importa. Si queremos explotar el conocimiento que encierra la información cognitiva necesitamos realizar economías de escala y crear grupos de documentos cuanto más grandes mejor. Es más interesante consultar ahora la internet —aunque también sea más problemático, pero para eso estamos los documentalistas— que hace cinco años, y dentro de otros cinco aún será más interesante, y así sucesivamente...

Síntesis de las propiedades de la información documental

Así que la propuesta que se presenta aquí es que la información de la que nos ocupamos los documentalistas tiene las tres características que se recogen en el cuadro número 1.

Esta propuesta tiene el defecto de que deja fuera algunas cosas del ámbito de trabajo y de estudio de la documentación, pero tiene la ventaja que delimita con claridad qué se supone que forma el núcleo de nuestras preocupaciones.

Estamos delimitando, por tanto, el ámbito de trabajo y el objeto de estudio que sería exclusivo —es decir, ninguna otra disciplina se ocupa de ellos— y específico de nuestra profesión.

No estamos diciendo que un documentalista profesional no suele asumir tareas informáticas o que no suele ocuparse de información administrativa. Decimos que esas no son las tareas que marcan la especificidad de la documentación, en tanto pueden y suelen, de hecho, desempeñarlas también otras profesiones, en concreto, los informáticos y archiveros, respectivamente. Esto último no significa, por su parte, que la archivística no se pueda considerar una parte de las Ciencias de la Documentación (ver trabajos como los de Álvarez-Ossorio, López Yepes o Guinchat y Menou, citados en la bibliografía), sino que ratifica que se trata de dos especialidades con objetos de estudio bien diferenciados.

En cualquier caso, entendemos que la ventaja principal, una vez que se asume la identificación y demarcación del ámbito de trabajo y de objeto de estudio basado en los tres puntos del cuadro número 1, es que nos prepara intelectualmente para deshacer un malentendido que plaga nuestra profesión en el entorno de la empresa, sobre todo en el entorno de la empresa privada.

Puede evitar también malentendidos profesionales y ayuda a quienes deseen concentrarse en los factores críticos para el éxito de su profesión a elegir su objeto de estudio.

Volviendo al entorno empresarial, el malentendido consiste precisamente en que no se suele reparar en la frontera real que separa la información administrativa —gestión de datos— de la información cognitiva —gestión del conocimiento—. De este modo, en el entorno de la empresa privada suele creerse que, si un procedimiento o un método de gestión sirve para confeccionar la nómina de final de mes, sin duda servirá también para gestionar los informes de mercado o las publicaciones que recibe el departamento de I+D.

Una de las diversas consecuencias de lo anterior, entre muchas otras, es la clásica tendencia, incluso en ambientes profesionales, a pretender gestionar colecciones de documentos cognitivos con herramientas relacionales puras.

Para decirlo ahora en términos un poco más abstractos, el problema es que, mientras la información administrativa es determinista, la información cognitiva es probabilista, y esa diferencia, si se tiene en cuenta, ayuda a diseñar mejores sistemas de información documental, pero si no se tiene en cuenta puede llevar al extravío, para volver a parafrasear a Bunge.

Se trata realmente de saber frente a descubrir. En concreto, las tecnologías y sistemas deterministas sirven para saber más cosas de una entidad determinada y previamente conocida. En cambio, las tecnologías y los sistemas probabilistas deben hacer frente a situaciones en las que, partiendo de una necesidad de información, hay que descubrir qué entidades cumplen unas determinadas condiciones.

Una modesta proposición

La propuesta que se desea defender aquí, por tanto, es la de delimitar con la máxima claridad el alcance de nuestra especialidad en lo que respecta a la gestión y el tratamiento de la información documental.

En este sentido, si queremos acertar en las recetas que pongamos en marcha en el desempeño de nuestra función, creo que tenemos que observar lo que aquí denominamos los cuatro principios básicos de la gestión y el tratamiento documental:

Primer principio: los documentos cognitivos son objetos complejos y de múltiples propiedades.

Gestionar conocimiento y gestionar documentos cognitivos es casi lo mismo. Un documento cognitivo es un trozo de mente de alguien, de su autor o autores, y por eso se puede decir que un documento cognitivo es uno de los artefactos más complejos del universo, y por ese mismo motivo no es útil pretender gestionarlos únicamente por asignación a una categoría unívoca de una clasificación.

Simplemente, no es cierto aquello de que “hay un lugar para cada cosa y cada cosa está en su lugar». Por tanto, todas las estrategias de gestión de información cognitiva basadas exclusivamente en asignaciones unívocas de documentos a clases o subclases están destinadas a ser muy ineficientes, a menos que formen parte de una estrategia más compleja. Esta estrategia compleja debe contemplar alguna forma de representación multidimensional en la que se tienda a la exhaustividad en la representación de las propiedades de los documentos.

Solamente de ese modo podremos empezar a diseñar sistemas de información preparados para descubrir, y no solamente para saber más de algo conocido.

Segundo principio: lo que más se parece a la inteligencia es una combinación de información sistematizada más meta información.

Tenemos un ejemplo en los logros recientes, y no tan recientes, de la Inteligencia Artificial y los Sistemas Expertos. Si tenemos reglas de producción del estilo “si..., entonces...”; más meta información del estilo que nos dice qué es cada segmento lingüístico, tal como “esto es un sujeto”, etc., obtendremos un sistema artificial que podrá simular comprensión del lenguaje.

De una manera más cercana a nuestros intereses, si tenemos una base de datos documental con campos homogéneos, podremos explotar la información mucho mejor que si disponemos de un montón de documentos indizados con un motor de recuperación de información. Si contamos con documentos sgml o xml bien etiquetados, podremos explotar el conocimiento que encierran y hacer minería de información, gestión del conocimiento, etc., mucho mejor que si únicamente tenemos codificación ascii o html.

Tercer principio: el lenguaje natural, la palabra y el texto, son la forma más potente de representación de la información.

La forma más potente de almacenar, transmitir y gestionar conocimiento es la información textual. Es fácil estar de acuerdo en que, a veces, una imagen vale más que mil palabras, pero también nos gustaría recordar otra afirmación no menos contundente: “si usted cree que una imagen siempre vale más que mil palabras, intente llevar su negocio solamente con imágenes».

Este principio tiene muchas consecuencias. Algunas de ellas causa sonrojo mencionarlas, pero dada la realidad del duro entorno empresarial en el que algunos documentalistas deben desarrollar su trabajo, cabe hacerlo: es poco o nada útil intentar desarrollar sistemas documentales abreviando los títulos de los documentos hasta hacerlos ininteligibles.

Son inviables supuestos sistemas de información documentales en los que solamente pueden recuperarse los documentos por la primera cadena de caracteres de cada campo. Por idéntica razón, es más razonable emplear los términos que forman parte de la descripción del documento, incluyendo el propio texto del documento, que usar estructuras jerárquicas (aparentemente) sofisticadas si esto último solamente funciona conociendo previamente qué queremos (¿entonces para qué lo queremos?).

Cuarto principio: el lenguaje natural es el principal agente generador de ruido y de silencio en la recuperación de información.

De modo que entre la tercera y la cuarta ley tenemos una bonita contradicción, o “lo mismo que te enferma, te cura y te da vida», en palabras del ciego al lazarillo de Tormes.

La situación es la siguiente: parece ser que el lenguaje natural es nuestro instrumento de codificación de conocimiento más importante. Pero el lenguaje natural posee un gran coeficiente de vaguedad a causa de los conocidos fenómenos de creatividad, sinonimia y homonimia, por no mencionar los problemas que provienen del uso de metáforas y de otras figuras habituales en el lenguaje natural.

El dilema, por tanto, visto de otra manera, queda así: pensamos en términos humanos —y no como hormigas, por ejemplo— gracias a que nuestro lenguaje natural no es ni inequívoco ni unívoco; pero eso mismo es lo que hace difícil utilizar el lenguaje natural como única vía para la recuperación de información.

Una de las consecuencias es que, si no tenemos más remedio, ciertamente haremos del defecto virtud y nos conformaremos con la indización en texto libro de los documentos, pero no fingiremos que los ordenadores pueden interpretar el significado de los términos e inferir que un texto que contiene expresiones como “aumento de precios» trata de <economía>. Por el contrario, aunque solamente sea para misiones críticas y siempre que el presupuesto lo permita, intentaremos combinar el texto libre con alguna forma de control terminológico.

En concreto, cabe esperar que en el futuro no sea difícil utilizar herramientas de análisis lingüístico en combinación con tesauros digitales y reglas de producción expertas que permitan, al mismo tiempo, usar información lingüística construida mediante esfuerzo intelectual humano (aunque una sola vez) y aplicarlas de manera automatizada cada vez que se requiera.

Prospectiva

Si se aceptan los cuatro principios anteriores, podemos ver en qué puede consistir el futuro de la gestión y el tratamiento de la información documental, conforme se mantenga la tendencia a la digitalización de la cultura:

  1. Serán más y más inviables las tecnologías deterministas, tales como las tecnologías relacionales puras.
  2. Serán más y más inviables los sistemas automáticos de análisis e indización documental basados exclusivamente en las propiedades estadísticas de los documentos.

Por lo tanto, ¿qué podemos esperar en lugar de lo anterior?:

  1. Aumentará la presión a favor de sistemas probabilistas, como los sistemas de gestión documentales que son capaces de crear índices analíticos, de trabajar con modelos de registro flexibles y de incorporar herramientas de control terminológico.
  2. Aumentará la presión a favor de sistemas automáticos de análisis e indización documental que contemplen el uso de herramientas tesaurales, posiblemente en forma de sistemas expertos que incorporen propiedades lingüísticas, semánticas y pragmáticas de la lengua en que están escritos los documentos y presentadas las necesidades de información.
  3. Aumentará la presión a favor de sistemas capaces de aprovechar el valor de las inferencias realizadas por seres humanos, como los nuevos sistemas de evaluación de recursos web donde cuenta la popularidad de un recurso o su visibilidad.

Conclusión

En el futuro, podemos esperar una nueva generación de sistemas de gestión del conocimiento basados en modelos mixtos donde no se despreciará el esfuerzo intelectual humano, sino que se hará todo lo posible para aprovecharlo, y dos de cuyos modelos básicos ya hemos anunciado arriba: sistemas de análisis e indización documental que utilizarán conocimientos lingüísticos codificados en forma de herramientas tesaurales, aunque empleadas probablemente de manera automática vía sistemas expertos, y algoritmos de evaluación y selección de recursos digitales donde los juicios de preferencia de los usuarios serán tomados en consideración.

Y esto nos lleva a una quinta ley, no enunciada antes, porque en realidad es un resumen de las cuatro anteriores, que se debe a Dagobert Soergel, y que dice lo siguiente:

Si queremos tener un modelo adecuado para comprender qué es un sistema de gestión documental, o qué es un sistema de gestión del conocimiento, deberemos rechazar, por ingenuo, el modelo según el cual consiste en sistemas que aceptan datos como entrada y producen información como salida, y tenemos que pasar a verlos como sistemas que aceptan documentos y necesidades de información como entradas y que producen personas informadas como salida.

Notas

  1. Versión adaptada, y notablemente ampliada, de la ponencia (no publicada) del autor expuesta en las VI Jornadas Españolas de Documentación Automatizada, Valencia, octubre de 1998, sobre gestión y tratamiento de la información.
  2. Esta elegante síntesis del nacimiento de la IA la he tomado en préstamo de mi colega de la universidad el Dr. Arcadio Rojo.

Referencias

Abadal, E. Els serveis d’informació electrònica, què són i per a què serveixen. Barcelona: Edicions Universitat de Barcelona, 1997.

Bunge, M. Racionalidad y realismo. Madrid: Alianza, 1985.

Bunge, M. Mente y sociedad. Madrid: Alianza, 1989.

Codina, L. «Modelo conceptual de un sistema de información documental». En: Revista española de documentación científica, vol. 17, n. 4, octubre-diciembre 1994, pp. 44-53.

Codina, L. «Metodología de análisis de sistemas de información y diseño de bases de datos documentales: aspectos lógicos y funcionales». En: Baró, J. y Cid, P. (eds.). Anuario Socadi de Documentación e Información 1998. Barcelona: Socadi, 1998, pp. 195-210.

Fuentes, Mª Eulàlia (ed.). Manual de documentación periodística. Madrid: Editorial Síntesis, 1995.

Guinchat, C.; Menou, M. y Blanquet, M. F. Introducción general a las ciencias y técnicas de la información y documentación. Madrid: Cindoc: Unesco, 1992.

López Yepes, José (coord.). Manual de información y documentación. Madrid: Pirámide, 1996.

Machale, P. D. George Boole: his life and work. Boole Press, 1985.

Pérez Álvarez-Ossorio, José R. Introducción a la información y documentación científica. Madrid: Alhambra, 1988.

Recoder, M. J.; Abadal, E. y Codina, L. Información electrónica y nuevas tecnologías. Barcelona: Promociones y publicaciones universitarias, 1991.

Saussure, F. de. Cours de linguistique générale. Publié par Charles Bally et Albert Séchehaye avec la collaboration de Albert Riedlinger. Réédition. Lausane, París: Payot, 1992 (la edición original es de 1916).

Salton, G. Automatic text processing: the transformation, analysis, and retrieval of information by computer. Reading: Addison-Wesley, 1989.

Salton, G. et al. «Automatic analysis, theme generation, and summarization of machine readable texts». En: Science, vol. 264, n. 3, junio 1994.

Salton, G.; Mcgill, M. J. Introduction to modern information retrieval. New York: McGraw-Hill, 1983.

Simon, H. A. Models of discovery and other topics in the methods of science. Boston: Reidel, 1977.

Simon, H. A. The sciences of the artificial. Cambridge: MIT press, 1996.

Soergel, D. Organizing information: principles of data base and retrieval systems. Orlando: Academic Press, 1985.

Soergel, D. «Information structure management: a unified framework for indexing and searching in database, expert, information-retrieval, and hypermedia systems». En: Fidel, Raya et al. (eds.). Challenges in indexing electronic text and images. Medford: Learned information, 1994.

Soergel, D. «An information science manifesto» (en línea). [Lugar web de la] American Society for Information Science........
http://www.asis.org/Bulletin/Dec-97/Soergel.htm

Rijsbergen, C. J. van. Information Retrieval. Londres: Butterworth, 1981.

Rijsbergen, C. J. van. «Towards an information logic». En: Communications of the ACM, 1989, pp. 77-85.

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1999/mayo/gestin_y_tratamiento_de_la_informacin_documental_una_propuesta_sobre_lmites_y_propiedades.html