Cargando...
Si eres nuevo en Kettle (ahora Pentaho Data Integration) te aconsejo dos cosas:
Creando un repositorio de Kettle:
Una traducción literal de la documentación seria: Un repositorio de Kettle (Kettle Repository) es un conjunto de tablas de base de datos que son accesibles por los clientes de Kettle (Spoon, Chef, Pan y Kitchen) para almacenar y recibir transformaciones, trabajos, conexiones de base de datos, etc.
Un poco más en detalle, un repositorio de Kettle es una base de datos que contiene las tablas necesarias para poder almacenar todos los “objetos” Kettle que creemos. Transformaciones, trabajos, conexiones estarán disponibles de forma centralizada, facilitando la reutilización y gestión de cambios.
El repositorio es independiente de la base de datos, Kettle sólo necesita que existan las tablas definidas en el esquema relacional incluido en la documentación (dentro de la directorio “docs” el documento “erd_kettle_repository.pdf”). Kettle no soporta oficialmente ningún otro método de acceso para los repositorios que no sea Native (JDBC) y las pruebas que he realizado demuestran que al menos con ODBC falla. No obstante, podemos acceder a casi cualquier base de datos con JDBC desde Kettle.

Para crear un repositorio de datos usaremos Spoon que permite crear y actualizar los repositorios de Kettle desde un interfaz grafico. Es sencillo, en la primera ventana de Spoon (sino hemos deshabilitado su aparición) tenemos que seleccionar el repositorio que deseamos utilizar, al mismo tiempo también nos permite las opciones de editar, actualizar (migrar a la nueva versión) o borrar el repositorio.
En nuestro caso, vamos a crear un nuevo repositorio, pulsamos el botón “New”. Para crear un nuevo repositorio primeramente tenemos que tener una conexión a la base de datos donde se almacenará.

Creamos una nueva conexión, es importante tener en cuenta dos cosas:

Una vez configurada la conexión daremos un nombre y una descripción al repositorio. Ahora si todo es correcto, simplemente pulsando el botón “Create or Upgrade” Spoon creará automáticamente todas las tablas y datos necesarios para el repositorio en la base de datos. Al mismo tiempo, toda la configuración de acceso creada quedará almacenada en el fichero “repositories.xml” dentro del directorio “.Kettle” (este a su vez dentro del directorio personal del usuario).
Una vez creado el repositorio, necesitamos también un usuario y un password para poder conectarnos. El primer usuario/password en un repositorio recién creado es admin/admin. El password puede ser (o mejor dicho, debería ser) cambiado después de realizar el primer lógin con el explorador de repositorio.
También se puede realizar auto-login en el repositorio, es cómodo aunque menos seguro. Para configurar el auto-login hay que configurar las siguientes variables de entorno KETTLE_REPOSITORY, KETTLE_USER and KETTLE_PASSWORD.
El explorador de repositorio
El “Repository Explorer” o Explorador de repositorio es la herramienta dentro de Spoon que nos permite ver y modificar los objetos almacenados en el repositorio al que estamos conectados.
De forma sencilla en una vista de árbol podemos ver los diferentes objetos que podemos almacenar en un repositorio (Conexiones, esquemas de partición, Slave Servers, Clusters, transformaciones, trabajos, usuarios y perfiles).

Dentro de las transformaciones y trabajos podemos crear a su vez una estructura de árbol para organizar nuestros objetos.
Backup del repositorio
Como siempre es importante asegurar la recuperación del trabajo realizado en caso de desastre y realizar una copia de seguridad de repositorio. Vamos a ver que es muy sencillo realizar un backup y puede ser en si otra de las ventajas de tener almacenados los objetos de Kettle en un repositorio.
Hay dos formas para realizar una copia de seguridad de los objetos de un repositorio.
Imprime este post
4 comentarios sobre Repositorio de objetos en Kettle
Gracias por el post, no me habia dado cuenta que hubiera una opcion para exportar todos los objetos del repositorio a un fichero XML, y en verdad es algo que me hacia falta
Señores:
Deseo que mi repositorio sea una bd Ms Access, esto es posible, ya que no me podido conectar via ODBC con una base de datos Ms Access, la documentación dice que simplemente crea el origien ODBC y luego accesarlo desde kettle con DSN, como se hace o que paso adicional existe
Ciertamente lo primero que intente cuando cree el primer repositorio de prueba fue utilizar una base de datos MS Access, por evitar posibles problemas en nuestros servidores SQL Server. El caso es que no funcionó, las secuencias de comandos que crean las tablas necesarias para el repositorio fallaban y al final utilice un servidor SQL Server.
He buscado y he encontrado este comentario de Matt Casters (http://forums.pentaho.org/showthread.php?p=174274). Todo parece indicar que alguno de los cambios realizados en las nuevas versiones de Kettle ha incluido alguna sentencia no valida en MS Access, además parece que no es el foco del proyecto resolver este problema de forma proactiva. Sí de verdad necesitas esta funcionalidad con MS Access, te recomiendo que abras una incidencia en la herramienta de tracking (http://jira.pentaho.org/browse/PDI)
[...] (nunca lo he utilizado). Aquí os dejo una referencia donde dan información más detallada http://www.xperimentos.com/2007/05/21/repositorio-de-objetos-en-kettle/. Una vez creado el repositorio sólo tenéis que cliclar en Tools/Repository/Import y seleccionar [...]
Deja tu comentario sobre Repositorio de objetos en Kettle
*Nota: Sólo se tendrán en cuenta los comentarios correctamente redactados y que estén relacionados con el tema de la entrada.RSS a los comentarios de esta entrada · TrackBack URI