viernes, 7 de enero de 2011

¿Qué es RSS –y XML, RDF, Atom,...?


El lenguaje de Internet para la creación de documentos electrónicos más conocido es el HTML, que es con el que se define la estructura y contenido de una página web. Consta de una serie de etiquetas (markups) predefinidas que permiten construir documentos que contienen títulos, párrafos y listas de texto, tablas, imágenes y otro elementos para la presentación de información.
Como mejora del lenguaje HTML original surge el lenguaje XML que además de pasar a ser "ascendiente" del HTML también da origen a otros sublenguajes como el RSS.

¿Qué son XML y XHTML?

XML, eXtensible Markup Language es un lenguaje más flexible y adaptable que el HTML y está diseñado para mejorar la funcionalidad de la Web. XML es un lenguaje de lenguajes (un metalenguaje), porque es utilizado para describir otros lenguajes que permiten contruir documentos electrónicos.
XML describe la estructura del documento, pero deja a libre elección el nombre que recibirá cada una de las etiquetas. El número de sublenguajes que pueden crearse apartir del metalenguaje XML es prácticamente ilimitado.
Uno de esos sublenguajes del XML es el actual XHTML, diseñado para sustituir el limitado lenguaje HTML. Por tanto XHTML es la conversión del lenguaje HTML al mismo lenguaje pero basado en XML, de modo que que XHTML es básicamente el HTML conocido hasta ahora pero adaptado a la estructuración de un documento XML.

¿Qué es entonces RSS?

RSS es otro sublenguaje surgido de la aplicación del metalenguaje XML. Por tanto un archivo RSS es un documento de texto compuesto por etiquetas acotadas entre los símbolos mayor y menor que similares a las utilizadas en el XHTML.
RSS corresponde a Rich Site Summary o Really Simple Syndication, y está diseñado para la distribución (syndication en inglés) de noticias o información tipo noticias contenidas en sitios web y weblogs.
Los archivos RSS comúnmente se llaman feeds RSS o canales RSS y contienen un resumen de lo publicado en el sitio web de origen. Se estructura en uno o más ítems. Cada ítem consta de un título, un resumen de texto y un enlace a la fuente original en la web donde se encuentra el texto completo. Además puede incluir información adicional como el nombre del autor o la fecha y la hora de publicación del contenido. Por tanto, cualquier fuente de información susceptible de poder ser troceada en items (los mensajes de un foro, por ejemplo) pueden distribuirse utilizando RSS.
Leyendo al archivo RSS de un sitio web es posible saber si se ha actualizado y con qué noticias o textos, pero sin necesidad de acceder a sus páginas web. El archivo RSS contiene además un enlace específico para cada ítem contenido en el feed que dirige a la página web con el texto completo de la noticia.
Para leer los feeds o canales RSS es necesario utilizar un programa llamado agregador. Este tipo de programas también se conocen como lectores de feeds o canales o agregadores de noticias, entre otras variaciones (¿Qué es un lector o agregador de feeds?)

¿Para qué sirve RSS?

La aplicación habitual del RSS es la distribución de los contenidos o de las noticias de una página web. Esto permite, por ejemplo, incluir los titulares de una página web en otra página web distinta, de modo que es posible y relativamente fácil construir una página web cuyo contenido esté formado por los titulares y resúmenes de los contenidos de una o más páginas web distintas.
Los archivos RSS, a diferencia de los archivos XHTML, no son interpretados por los navegadores web y al abrirlos lo que hacen es mostrar el código XML que compone el archivo RSS. Los feeds o canales en formato Atom son parcialmente visualizados por los navegadores, pero mostrando un aviso de que el documento corresponde a un feed y no a una página web. Para visualizar directamente un feed RSS es necesario utilizar un programa lector o agregador de feeds.

¿Qué es un lector o agregador de feeds?

Un lector o agregador de feeds es una aplicación local o basada en web que interpreta los archivos RSS y visualiza su contenido.
Incluyendo varios feeds RSS en el agregador es posible leer una versión resumida o previa de los contenidos de múltiples sitios web sin necesidad de visitarlas individualmente --excepto cuando se desee leer la versión ampliada de las noticias seleccionadas.
Las noticias lleguan al usuario cuando éste inicia su programa lector de feeds RSS, en lugar de que el usuario deba ir a leer las noticias a las diferentes fuentes o sitios web donde se publican. El uso de un lector de feeds supone un gran ahorro de tiempo y de incomodidades cuando se es lector habitual de un puñado de sitios web distintos ya que es posible echar un vistazo rápido a todos los contenidos nuevos publicados en varias decenas de sitios web distintos en prácticamente el mismo tiempo que supondría consultar vía web un único sitio.
Cada vez que el usuario añade un feed o canal a su programa agregador o lector de feeds se dice que se suscribe a ese feed.
¿Cómo me suscribo a un feed?
Los archivos RSS, al igual que las páginas web, disponen de un URL o dirección de Internet del tipo http://www.microsiervos.com/index.xml.
Por tanto, para tener acceso o para suscribirse a un feed hay que conocer su URL dirección en Internet e indicar esa dirección en el programa agregador o lector de feeds de modo que pueda encontrarlo y mostrar su contenido.
Normalmente los sitios web que disponen de feed RSS indican cuál es el URL de su feed de alguna forma similar a las descritas en Nomenclaturas de los feeds o canales RSS.
También existen directorios de feeds RSS, listas de favoritos o buscadores de contenidos y feeds RSS.

¿Qué son RDF y Atom?

Existen distintas versiones del lenguaje RSS: las versiones 0.90 y 0.91 son las primeras y fueron desarrolladas por Netscape. La versión 1.0 fue desarrollada por un grupo independiente basándose en el formato RDF. La versión 2.0 (y antes que ésta distintas versiones 0.9x) fue el resultado de la adopción de la tecnología de Netscape por parte de la empresa UserLand Software. Todas ellas están basadas en el lenguaje originalmente definido por Netscape pero no todas son compatibles entre sí.
  • RDF — La versión 1.0 del lenguaje RSS también es conocida como RDF. Por este motivo algunos feeds o canales RSS están etiquetados como "RSS 1.0" o "RDF" y guardados en archivos con extensión ".rdf".
  • RSS2 — A la versión 2.0 del lenguaje RSS también se llama RSS2. Por tanto algunos feeds o canales RSS están etiquetados como "RSS2" o "RSS 2.0".
  • Atom — Atom también es un sublenguaje XML. No se corresponde ni se basa en ninguna versión de RSS, pero es un formato muy similar a éste y que sobre todo tiene el mismo objetivo: permitir la distribución de contenidos y noticias de sitios web. La versión más actual es la 0.3 de febrero de 2004. Las mejoras que supone respecto a RSS (en cualquiera de sus versiones) hacen que su uso se extienda rápidamente a pesar de ser algo más complicado. Un documento Atom puede contener más información (y más compleja) y es más consistente que un documento RSS.

Nomenclaturas de los feeds o canales RSS

Como RSS y Atom están basados en el metalenguaje XML en muchas ocasiones los feeds RSS están etiquetados como "XML" y se guardan en archivos con extensión ".xml". Pero también pueden tener extensión ".rdf" o ".rss". En realidad la extensión utilizada es lo de menos, lo importante es el contenido del documento.
Cuando en el ámbito de los feeds o canales RSS se etiqueta un archivo como "XML" quiere decir que el lenguaje utilizado por ese archivo puede ser RSS en cualquiera de sus versiones (0.9x, 1.0/RDF o 2.0/RSS2) o que puede ser Atom. Pero fuera de este ámbito un documento XML no siempre corresponde a un feed o canal RSS. Incluso puede no tener nada que ver con la distribución de contenidos.
Por tanto "RSS 0.9x, 1.0 o 2.0" es lo mismo que "RDF" y que "Atom" que a la vez son lo mismo que un feed o un canal RSS. Y también "XML" significa lo mismo y engloba a todos ellos siempre que se esté en el ámbito de la distribución o sindicación de contenidos.
Las extensiones más utilizadas para nombrar archivos correspondientes a feeds o canales son ".xml", ".rdf" o ".rss", aunque también se pueden encontrar extensiones tipo ".php" o ".js".
Otras formas de identificar un enlace a un canal o feed RSS que se utilizan muy habitualmente son Syndicate this site/Sindica este sitio, Site Syndication/Sindicar sitio, Canal o Feed XML/RSS/RDF, Archivo o Canal de suscripción, etc.
También se utiliza una variada serie de iconos con algunas de las siglas referidas sobre fondo azul o naranja principalmente. Algunos ejemplos:

¿Cómo se crea un canal o feed?

Crear un canal o feed RSS es mucho más sencillo que crear una página web, en tanto su contenido es menor y el número de etiquetas que utilizan más reducido. Sin embargo, los canales o feeds RSS normalmente se generan automáticamente por las herramientas de publiciación utilizadas en la mayoría de sitios web y weblogs, y se reescriben con el nuevo contenido conforme se actualiza el contenido de la página web.
Si utilizas un programa para la publicación de tu sitio web o tu weblog (tales como MovableType, Blogger o similares) es muy sencillo activar la opción para que se genere un feed RSS de tu sitio web.

No hay comentarios:

Publicar un comentario

Animate a comentar

Tus comentarios nos ayuda a seguir !!!

Related Posts with Thumbnails