El profesional de la información


Enero 1998

Hacia un concepto documental de sede web

Por Isidro Aguillo

En el entorno bibliográfico tradicional la unidad documental podía quedar definida de forma precisa de acuerdo a criterios físicos según el soporte utilizado. Dichas unidades, objeto posterior de análisis, catalogación e indización, raramente planteaban dudas sobre su identidad, extensión, autoría u otras características formales que ayudan a identificarla de forma individualizada.

La irrupción de internet, y sobre todo el auge del World Wide Web, ha dislocado este esquema al convertir en difusas las fronteras entre las distintas unidades de información. Por ello, resulta necesario introducir nuevos conceptos que definan de manera más precisa la unidad de trabajo documental en el web. Cualquier avance en este campo es fundamental para profundizar en la descripción y catalogación de los recursos electrónicos, una tarea que puede ser primordial para el futuro de nuestra profesión en los próximos años.

La propuesta es abandonar los criterios de definición físicos, basados en el soporte, en favor de otros relativos al contenido. Así distinguiríamos:

  • Sitio web: lugar físico interconectado a la red internet donde está depositada la información en formato electrónico accesible mediante protocolo http. Puesto que estamos hablando de soporte físico informático, un ordenador actuando como servidor WWW con número IP propio diferenciado.
  • Página web : fichero o conjunto de ficheros informáticos que constituyen un documento html identificable a través de la red con una URL propia característica, que puede ser en cualquier formato.
  • Sede web : es un conjunto de páginas ligadas jerárquicamente, que constituyen una unidad diferenciada e independiente, tanto en función de contenidos (unidad documental), como de organización responsable (unidad institucional).

Sedes web

Dos son las características fundamentales que definen una sede web:

  • Identidad.
  • Reconocibilidad.

Una sede ha de ser identificable inequívocamente como tal, tanto en sus aspectos formales como de contenidos. Asimismo, en la mayoría de los casos existe una equivalencia entre la identidad institucional y la identidad como sede web.

Un documento nunca es una sede web, independientemente de su extensión física como del número de páginas web que lo componga. Se incluyen tanto los documentos formales a texto completo (artículos, libros, memorias, etc.), como los fragmentarios (referencias bibliográficas, resúmenes, listados, etc.) o los informáticos: ficheros ejecutables (programas), ficheros multimedia (gráficos, vídeos, sonidos...).

No se podrá definir sedes web sobre la base de criterios cronológicos.

Una sede web es identificada por la URL de mayor rango que contenga todas las páginas que la componen. Puede tener una o varios miles de página, y contener a su vez otras sedes que compartan o complementen su identidad.

Por tanto, nos podemos encontrar con sitios web donde se hallen varias sedes web (lo que obliga a descripción utilizando URLs de bajo nivel jerárquico), o viceversa, sedes web sobre varios sitios web (irrelevante a fines documentales).

Sedes anidadas

Un concepto de "subsede" parece poco apropiado desde un punto de vista documental, por lo que la identificabilidad de un conjunto de páginas es independiente de que se encuentren o no bajo una jerarquía determinada. En esos casos, hablaremos de sedes anidadas.

Tipología documental de las sedes

Por sus contenidos, podemos establecer:

  • Sede primaria. La sede fuente, de carácter institucional o personal, que presenta información original.
  • Sede secundaria. La sede que sirve de referencia, y consta de un directorio o índice de recursos más o menos amplio.
  • Super sede. Sede que ofrece un gran volumen de información sobre una disciplina concreta, incluyendo listados o bibliografías, acceso a bases de datos y, especialmente, catálogos de otras sedes.

Catalogar sedes

La catalogación exige la disponibilidad del mayor número de elementos identificativos posibles, por lo que se recomienda catalogar preferentemente las sedes de grado superior (aquellas con URL de raíz de nivel 0 o muy baja).

Indizar sedes

Frente a la indexación automática de las sedes, generando ficheros inversos de sus contenidos íntegros, las sedes se pueden describir mediante la asignación de descriptores construidos con lenguajes controlados. La utilización de un número elevado de categorías redunda en la calidad de la descripción y permite la realización posterior de análisis más finos. La indización completa debe asegurar la evaluación de la calidad formal y de contenidos de la sede, con mención explícita del grado de actualidad de la misma.

Nota remitida a IweTel por Isidro F. Aguillo, Programas Europeos, Cindoc-Csic. Joaquín Costa, 22. 28002 Madrid.

isidro ARROBA cindoc.csic.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/enero/hacia_un_concepto_documental_de_sede_web.html