LENGUAJE DE MARCADO EXTENSIBLE (XML)
Es un conjunto de reglas para la codificación de documentos en forma electrónica, es un formato sencillo , texto muy flexible derivado de SGML (ISO 8879) . Originalmente diseñado para afrontar los retos de la publicación electrónica a gran escala , XML también está desempeñando un papel cada vez más importante en el intercambio de una amplia variedad de datos en la Web y en otros lugares.
La función de XML en la gestión de contenidos
Es importante definir las funciones que caracterizan una aplicación de gestión de contenidos, como también es necesario dar respuesta a dos cuestiones: ¿qué función cumple el lenguaje XML en este tipo de sistemas? y ¿cuáles son las ventajas que podemos obtener de su aplicación?
las ventajas de la gestión de contenidos y la clara diferenciación entre los contenidos propiamente dichos y las plantillas que se utilizan para su edición y visualización, de forma que es posible reutilizar un mismo contenido en distintos contextos. Esta es una de las principales ventajas del formato XML: la distinción entre contenidos y presentación.
Otros de los aspectos donde se manifiesta el potencial del lenguaje XML aplicado a la gestión de contenidos es la gestión del repositorio de metadatos asociados a las distintas páginas. Son numerosos los sistemas de metadatos propuestos en los últimos años para la recuperación de información que han optado por XML como formato de codificación. En este grupo tendríamos Dublin Core, MARCXML, MODS, etc. Pero donde resulta más evidente la aplicación de XML es en los procesos de intercambio, transferencia e integración de información. De hecho, si bien sería posible obviar la utilización de XML en el almacenamiento de contenidos y en la gestión de metadatos, la integración y sindicación de contenidos resultaría prácticamente inabordable sin la utilización de este formato.
XML como base para el almacenamiento de contenidos
Los contenidos gestionados y publicados a través del sitio web pueden almacenarse de distinta forma, aunque para garantizar su posterior reutilización y recuperación debemos considerar las ventajas que ofrece XML como lenguaje de almacenamiento frente a otras alternativas como HTML. Se debe citar la importancia que en los últimos años están alcanzando las llamadas bases de datos XML nativas. Con este término nos referimos a bases de datos que almacenan y gestionan una colección de documentos XML sin realizar ningún tipo de transformación previa. En este modelo, el documento XML es la principal unidad de almacenamiento de la información. Contrasta este tipo de bases de datos con las bases de datos relacionales, en las que la información se guarda en una colección de tablas formadas por campos y registros, con una estructura sumamente rígida que debe ser predefinida con anterioridad, y que en muchas ocasiones no da cabida a la flexibilidad que exige el almacenamiento de documentos de naturaleza textual.
Entre los principales exponentes de las bases de datos XML nativas podemos destacar sistemas comerciales como Tamino, de la empresa alemana Software AG, Textil, o el sistema código abierto DBXML, que se puede obtener gratuitamente. No obstante, una aplicación de gestión de contenidos no tiene que estar vinculada, forzosamente, a una base de datos XML nativa. Aunque se opte por almacenar los textos en formato XML, cabe la opción de guardarlos en un sistema de bases de datos relacional utilizando los tipos de datos que permiten guardar y gestionar campos de texto de longitud variable.
Para facilitar la edición de contenidos en XML, los principales proveedores de herramientas de edición han publicado utilidades que permiten la interacción entre éstas y el repositorio de datos de la aplicación de gestión de contenidos. Encontramos ejemplos de esta integración en las propuestas de las empresas Altova, Blast Radius, XYEnterprise o Stylus.
XML como modelo para la representación de metadatos
Algunos de los sistemas de metadatos que se han publicado en los últimos años han optado por el lenguaje XML como principal mecanismo de representación y codificación de los mismos. Las ventajas de usar XML frente a otras alternativas se encuentran en su orientación hacia Internet, la facilidad de su intercambio y posterior procesamiento utilizando una única sintaxis común, y la opción de combinar e intercalar los metadatos dentro del texto completo de los documentos. Así, sería posible codificar un texto usando un conjunto de etiquetas o marcas relevantes para ese tipo de información, y agregarle metadatos descriptivos o administrativos como parte de la cabecera de dicho documento, codificados en cualquier otro vocabulario siempre que éste también esté basado en la sintaxis XML.
Si se opta por usar XML para la codificación de los metadatos debe considerarse la necesidad de disponer de un sistema de indexación y recuperación que permita discriminar documentos a partir del contenido de elementos o atributos específicos. Es decir, el sistema de búsqueda no sólo debe permitir la búsqueda en texto completo (esto es, poder recuperar el documento si contiene una combinación de palabras en particular), sino también si dichas palabras aparecen dentro de un elemento específico o en alguno de sus elementos descendientes. Sólo de esta forma se pueden obtener las ventajas de la organización jerárquica de la información que caracteriza al lenguaje XML.
En este sentido, las bases de datos XML nativas incorporan este tipo de herramientas y utilidades de búsqueda. Las aplicaciones de gestión de contenidos que utilizan otro sistema de repositorio (normalmente una base de datos relacional), presentan aquí algunas limitaciones, ya que esta tecnología no suele incorporar herramientas de indexación adaptadas a las características del formato.
XML como medio de intercambio e integración de contenidos
Señalábamos con anterioridad la función primordial de XML como facilitador del intercambio y agregación de contenidos. Decíamos que es en este área donde mayor y más evidente se hace la capacidad y el potencial del formato en las actividades relacionadas con la gestión de contenidos. Pues bien, debemos recordar que XML no se trata, únicamente, de un formato para codificar textos y documentos, sino de una familia de especificaciones que establece la forma en la que se pueden procesar y presentar dichos textos. Especificaciones como XSLT, DOM o XPath hacen posible procesar documentos XML basados en distintos vocabularios mediante distintos lenguajes de programación (Visual Basic, Java, etc.), utilizando un modelo común, estándar y claramente documentado.
La posibilidad de obtener a través de la red documentos XML y procesarlos con facilidad para cualquier fin (por ejemplo, para integrarlos en un repositorio o base de datos, o para visualizarlos como parte de nuestro sitio web), nos ofrecen una flexibilidad extrema y abre las puertas a cualquier tipo de integración.
Fuente: