Formulario Contacto EPI Contacto
Copyright Copyright

 

Septiembre-octubre de 2013, vol. 22, núm. 5
Gestión de contenidos


Marcado semántico automático en gestores de contenidos: integración y cuantificación

Texto completo

Juan-Antonio Pastor-Sánchez, Enrique Orduña-Malea y Tomás Saorín

Resumen: Se ofrece en primer lugar una visión general de los diferentes formatos de marcado semántico así como de las tecnologías existentes para incorporar información semántica explícita (microformatos, microdatos y RDFa). Posteriormente se describen algunos servicios que permiten automatizar los procesos de anotación semántica (Sindice, Calais, AlchemyAPI y DBPedia Spotlight) al tiempo que se caracteriza el ciclo completo de este proceso en un CMS concreto (Wordpress) mediante un plugin especializado (RDFaCE-Lite). Finalmente, con el propósito de cuantificar la creación y la conectividad del contenido marcado semánticamente en la Web, se analiza el conjunto de universidades españolas (y una selección de 25 universidades internacionales) mediante Sindice. Para ello se calculan indicadores de tamaño semántico y de enlaces entrantes, salientes, internos y de terceros (third party links) en los datasets de las universidades de la muestra. Los resultados indican la todavía escasa presencia de contenido marcado semánticamente en las universidades, así como el alto aislamiento en visibilidad web de estos contenidos.

Palabras clave: Web semántica, Linked data , Marcado semántico, Gestores de contenidos, Wordpress, RDFaCE-Lite, Sindice, Universidades, Webometría.

Automatic semantic markup in content management systems: integration and quantification

Abstract: A general overview of the different semantic markup formats and the existing technologies to incorporate explicit semantic information (microformats, microdata and RDFa) is provided. Services are described that automate, to some extent, semantic annotation processes (Sindice, Calais, AlchemyAPI and DBPedia Spotlight), while characterizing the complete cycle of this process in a particular CMS (Wordpress) using a specialized plugin (RDFaCE-Lite). Finally, in order to quantify the creation and connectivity of semantically marked content on the Web, the space formed by all Spanish universities (and a selection of 25 international institutions) is analysed with Sindice. Semantic page count and visibility indicators (inlinks, outlinks, internal and third party) are calculated for the sample. The results indicate limited presence of semantically marked content in the universities and highly isolated web visibility of this content.

Keywords: Semantic web, Linked data, Semantic markup, Content management systems, Wordpress, RDFaCE-Lite, Sindice, Universities, Webometrics.