Kettle logoLa nueva versión 3.0 de Kettle ya está muy cerca, Matt Casters ha publicado en su Blog el anuncio oficial de la versión 3.0.0 M2.

Utilizo kettle desde hace bastante tiempo y me parece una extraordinaria herramienta ETL, sin lugar a dudas es el mejor ELT OpenSource a día de hoy. La crítica desde mi punto de vista es que últimamente están enfocados en el proyecto Pentaho Data Integration (Kettle) en poder competir en funcionalidad y velocidad con herramientas comerciales (Informatica, Microsoft Integration Services, Sunopsis (ahora Oracle Data Integrator), DataMirror y DataStage (ambas de IBM)

Las implicaciones son que aunque cada día aparecen más y mejores funciones (más rápidas, sencillas, versátiles) hay cosas que en versiones anteriores funcionaban y que dejan de funcionar o hacen cosas incorrectas, como paso al cambiar de la versión 2.4 a la versión 2.5. Cada nueva versión incorpora muchísimas mejoras, pero no hay suficiente control en asegurar que no se han aparecido errores en las funciones ya existían.

Ejemplo interfaz de Kettle 3.0.0 M2

Resultado es que hay transformaciones que dejan de funcionar al cambiar de versión o errores en cosas que antes funcionaban sin problemas. Desde mi humilde punto de vista sería de agradecer la aparición de versiones 3.0.1, 3.0.2…. etc.

A pesar de todo Kettle es una magnifica herramienta y la nueva versión 3.0 ha mejorado en muchos aspectos:

  • Visualmente es mucho mejor, aunque tengo cierta nostalgia de los antiguos iconos que casi me sabía de memoria.
  • Nuevos pasos:
    • Paso para importar datos desde la base de datos ROLAP Mondrian usando MDX.
    • Paso para evaluar expresiones regulares.
    • Paso para importar datos directamente desde Access.
    • Paso para importar ficheros CVS de forma más rápida y eficiente.
    • Paso para importar ficheros de texto con campos de ancho fijo.
  • Soporte de para el repositorio de objetos mejorado.
  • Mejora de rendimiento al implementar una nueva arquitectura que separa datos y metadatos.
  • Nueva arquitectura para añadir plugins, simplifica el trabajo de crear nuevos tipos de pasos.
  • Mejoras para trabajar en entornos cluster.
  • Botón para acceso directo al explorador de bases de datos.
  • Corrección de errores de la versión 3.0.0 M1.

Importante:

  • Esta versión NO es válida para entornos en producción.
  • La versión 3.0.0 requiere Java 5 o superior. Aunque erróneamente en los ficheros .bat (ejem spoon.bat) sigue figurando la línea comentada para incluir en el path la versión 1.4 de java.

Enlaces:
Noticia
Descarga (77MB zip file) Kettle version 3.0.0 M2

Be Sociable, Share!