XperimentoS

Experiencias Profesionales…

Archivo para 'XML' Categoría


ROME - librería open source para generar RSS

Publicado por ildapena en Febrero 28th 2008

ROME es una librería open source Java para compilar, generar y publicar feeds de RSS y Atom.

La parte principal de la librería ROME depende del compilador JDOM XML y soporta todos los  formatos de RSS y Atom incluyendo RSS 0.90, RSS 0.91 Netscape, RSS 0.91 Userland, RSS 0.92, RSS 0.93, RSS 0.94, RSS 1.0, RSS 2.0, Atom 0.3, y Atom 1.0.

Se ofrece tanto el código fuente como binarios para Windows o Linux.

Requiere J2SE 1.4 o superior y JDOM 1.0

Enlaces:

Publicado en Java, Programación, XML | Sin Comentarios »

¿Cómo crear un documento RSS?

Publicado por ildapena en Febrero 25th 2008

Si en el post anterior se veía los conceptos relacionados con la sindicación y los feeds, en este nos centraremos en el documento RSS que se genera para ofrecerlo al resto de webs.

Lo primero que cabe indicar es que las iniciales RSS engloba varias especificaciones:

  • Rich Site Summary (RSS 0.91).
  • RDF Site Summary (RSS 0.9 y RSS 1.0).
  • Really Simple Syndication (RSS 2.0).

Por lo demás, un documento RSS no es más que un documento XML, por lo que su estructura a base de marcas y etiquetas que estructuran la información. En concreto, sigue el formato definido por la W3C que tendría un aspecto similar a:

<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>XML.com</title>
    <link>http://www.xml.com/</link>
    <description>XML.com features a rich mix of information and services for the XML community.</description>
    <language>en-us</language>
    <item>
      <title>Normalizing XML, Part 2</title>
      <link>http://www.xml.com/pub/a/2002/12/04/normalizing.html</link>
      <description>In this second and final look at applying relational normalization techniques to W3C XML Schema data modeling, Will Provost discusses when not to normalize, the scope of uniqueness and the fourth and fifth normal forms.</description>
      <dc:creator>Will Provost</dc:creator>
      <dc:date>2002-12-04</dc:date>   
    </item>
   </channel>
</rss>

El objetivo de un documento RSS es generar resúmenes del contenido de un sitio web, representado por la etiqueta <channel>, para ponerlo a disposición del resto de mundo Internet. Esta acción es lo que se conoce también como sindicación.
Como vemos la etiqueta channel requiere de 3 elementos: title (el titulo del sitio web al que se refiere), link (la url de nuestro sitio web) y description (descripcion de nuestro RSS).

Mas información sobre las etiquetas RSS en make-rss-feeds 

Existen herramientas como FeedForAll muy faciles de usar, que te permite crear, editar y publicar tus documentos RSS.
Incluso, ofrece scripts para generar feeds a partir de bases de datos MySQL

El administrador debe preocuparse de actualizar el documento RSS publicado. Para ello se puede tener un script que se ejecute periódicamente, o bien se puede regenerarlo cada vez que ocurra un evento (por ejemplo al escribir un post), puedes generarlo siempre dinámicamente (lo que implica generarlo cada vez que se pide aunque no haya cambiado su contenido).

Sin embargo, dado el batiburrillo de versiones y acepciones de RSS se ha buscado un nuevo formato para la sindicación de contenidos. Así es como surge Atom 1.0, como formato para los documentos XML puesto al servicio de los agregadores.

Enlaces:

Publicado en XML | Sin Comentarios »

Publicidad

¿Cómo sindicar contenidos de otros sitios Web?

Publicado por ildapena en Febrero 24th 2008

En la gestión de contenidos cabe distinguir tres posibles roles:

  • creador de contenido,
  • sindicador –que agrega contenidos, los paquetiza y los revende–,
  • y distribuidor –que finalmente lo lleva hasta los consumidores

Los documentos RSS son parte de la familia de los formatos XML desarrollado específicamente para todo tipo de sitios web que se actualizan con frecuencia y por medio del cual se puede compartir la información y usarla en otros sitios web o programas, sin necesidad de acceder a ella directamente, mostrando un resumen rápido de la misma.

Los programas que leen y presentan fuentes RSS de diferentes procedencias se denominan agregadores.

Gracias a los agregadores o lectores de feeds (programas o sitios que permiten leer fuentes RSS) se puede obtener resúmenes de todos los sitios que se desee desde el escritorio de tu sistema operativo. Gracias a los feeds, no es necesario abrir el navegador y visitar decenas de webs. En esto consiste la sindicación de contenidos.

Una vez que se ha generado el documento RSS, para acceder al contenido de dicho documento lo más sencillo es a través de un canal RSS o feed. 

Tipos de agregadores

  • Via web. Para estos es necesario registrarse. La ventaja es que puedes acceder al servicio desde cualquier ubicación a través de Internet
  • Integrados en el navegador web como un plug-in: Bloglines o google reader
  • Programas que se instalan en el PC, de modo local: RSSReader , FeedReader, SharpReader, FeedDemon, Pluck,

Existen muchas otras herramientas que te permite vía web, recoger los rss de las paginas web y crear tu propio feed, como las 7 herramienta que se analizan en este post. De entre estas, destaca page2rss que se caracteriza por ayudar a controlar sitios web que no publican feed, comprobando cualquier actualizacion de la pagina web y redirigiendola al agregador RSS que se emplee.

Enlaces:

Publicado en XML | Sin Comentarios »

El futuro XHTML 2.0

Publicado por ildapena en Febrero 20th 2008

La familia XHTML

Dentro de XHTML se pueden distinguir 4 versiones:

  • XHTML 1.0 (con las 3 versiones: strict / transitional / frameset). Viene a ser una transición desde HTML 4 pero expresando según gramática XML.
  • XHTML 1.1: Revisión de XHTML 1.0. Se adopta como “Strict”
  • XHTML Basic: Para pequeños dispositivos. Incluye móviles y muy pronto impresoras y TV
  • XHTML 2

XHTML 2. Objetivos

Entre los objetivos que persigue el futuro XHTML 2.0 estan:

  • Que los documentos sean tan puros como sea posible. Esto es sean XML puros
  • Centrase en la estructura y eliminar las etiquetas de presentacion
  • Mayor usabilidad
  • Mayor accessibilidad
  • Mejor internacionalización (i18n)
  • Mayor independencia de los dispositivos
  • Reducir el scripting
  • Mejor gestión de eventos
  • XForms

Pero lo mas llamativo de esta nueva versión es que va a ser un cambio radical en la creación de paginas web
y esto ser refleja en el hecho de que no va a ver compatibilidad hacia atrás, como así anuncio la propia World Wide Web Consortium (W3C) en el lanzamiento del borrador de XHTML 2.0 (5 August 2002). Anteriormente, con la versión XHTML 1.0 y 1.1, más que cambios eran añadidos, de manera que un navegador que leía HTML 4.01 podía interpretar XHTML 1.0.
Pero la realidad es que XHTML 2.0 elimina los forms y frames, además de las etiqueta b, i, y img. Incluso la etiqueta br. La razón para ello es que XHTML quiere eliminar toda etiqueta que se refiera a la presentación y centrarse solo en la estructura. La creación de una verdadera Web Semántica está detrás de todo esto.

XForms

XForms es una de las novedades que introduce XHTML2.0. Se caracteriza por:

  • Client-side checking (no scripting)
  • Devuelve datos tipo XML
  • Las marcas de control se separan de los datos
  • Controles son independientes del dispositivo

Ejemplos de XForm

Borrador del W3C

Un análisis muy bueno de lo que va suponer para el programador.

Publicado en XML | Sin Comentarios »

Publicidad

HTML 4.01 vs XHMTL 1.1

Publicado por ildapena en Febrero 18th 2008

HTML

HTML 4 es un derivado de SGML (Standard Generalized Markup Language), según la norma ISO 8879, y por tanto, es un lenguaje de etiquetas. Se le ha reconocido como el lenguaje estándar para la publicación de paginas web (World Wide Web) durante mucho tiempo.

XHTML

Por su parte, XHTML es un lenguaje basado en XML que trata de reproducir y, a la vez, extender el lenguaje HTML. 

Entre los beneficios que aporta XHTML frente a HTML se encuentran:

  • Los documentos XHTML siguen el formato XML. Por ello son fácilmente editables y validados empleando cualquier herramienta XML.
  • Es soportado por los navegadores.
  • Los documentos pueden utilizar aplicaciones (scripts y applets) que se apoyan tanto en el HTML Document Object Model como el XML Document Object Model (DOM).
  • Al ser documentos XML, se pueden aprovechar de los beneficios propios de estas gramáticas.

Diferencias XHTML y HTML

La siguiente lista muestra algunas reglas de XHTML que lo diferencian de HTML:

  • Los elementos vacíos deben cerrarse siempre:
    • <br></br> o <br/> o <br />
  • Los elementos no vacíos también deben cerrarse siempre:
    • <p>Primer párrafo</p><p>Segundo párrafo</p>
  • Los elementos anidados deben tener un correcto orden de apertura/cierre (el que se abre último, debe cerrarse primero).
    • <em><strong>Texto</strong></em>
  • Se debe siempre especificar un texto alternativo para imágenes (atributo “alt” para la etiqueta “img”).
  • Los valores de los atributos deben siempre ir encerrados entre comillas (simples o dobles).
    • Correcto: <td rowspan=”3″>
  • El símbolo & (ampersand) debe ser usado únicamente como parte de una entidad.
    • Cars &amp; houses
  • Los nombres de elementos y atributos deben ir en minúsculas.
  • No está permitida la minimización de atributos (se usa el nombre del atributo como valor).
    • <textarea readonly=”readonly”>Solo-lectura</textarea>
  • Los atributos desaprobados en HTML 4.01 no forman parte de XHTML.
    • <span style=”color: #0000FF;”>Blue text</span>

Referencia de XHTML con un análisis de cada una de las etiquetas que conforma el lenguaje.

Estándar XHTML 1.1 en el W3C

Publicado en XML | Sin Comentarios »

 
Cerrar
Enviar por Correo