XperimentoS

Experiencias Profesionales…

Archivo para Noviembre, 2007

Palo ETL-Server

Publicado por lcflores en Noviembre 30th 2007

Palo logoJedox ha anunciado el lanzamiento de Palo ETL-Server para el primer trimestre del año 2008. Este servidor permitirá (como todo buen ETL) extraer los datos heterogéneos de diferentes orígenes, transformar los datos y cargar el resultado en Palo.

La definición del proceso ETL será almacenada en un fichero XML que podrá ser utilizado para lanzar las cargas de datos en un proceso por lotes. La novedad viene dada porque el ETL-Server suportará el proceso contrario, es decir, ir de los datos agregados en Palo a los datos originales (drill-through). Está opción es muy interesante y dará respuesta a la pregunta sobre el origen de los datos.

ETL-Server será una aplicación Cliente-Servidor basada en una arquitectura Java que permitirá independencia en la plataforma. También contará con todas las características de un buen ETL: datos separados de metadatos, extendible, soporte para las bases de datos más comunes,…

El Open Source Palo ETL-Server estará disponible bajo licencia GPL, ciertamente una buena noticia.

Sólo una pequeña crítica, al final crearán su propio ETL desde cero en lugar de haber intentado integrar su modulo dentro de alguno de los potentes ETLs OpenSource existentes (Kettle, Talend), estos ETLs disponen de muchas funciones muy probadas y a Jedox le costará mucho esfuerzo poder llegar a su nivel.

Enlaces:
Palo
Palo ETL-Server noticia
Kettle (Pentaho data integration)
Talend Open Studio

Publicado en Bases de datos, Business Intelligence, Noticias | 2 Comentarios »

La importancia del modelo de datos para el mantenimiento de la información

Publicado por lcflores en Noviembre 29th 2007

Xperiencias Con la experiencia, el diseño de una base de datos se convierte en algo casi mecánico. En el proceso de modelado aplicamos reglas y generamos diseños normalizados e incluso desnormalizados casi sin pensar a través de la información adquirida en entrevistas con las personas de negocio.

Ciertamente, un buen diseño de base de datos es crítico para cualquier proyecto, pero no siempre el fiel reflejo de la realidad es lo mejor en todos los casos.

En un proyecto se creó una base de datos para mantener la información de cierto tipo de construcciones que contenían varios elementos. Como ejemplo, contemplemos sólo 3 elementos y simplifiquemos llamándolos elementos A, B y C, donde: A está formado por n elementos B; y B está formado a su vez por n elementos C. El diseño sería:

  EjemploRelacion_1

Este modelo era totalmente correcto, pero la aplicación fracasó ya que no se utilizaba, ¿dónde está el problema?.

Durante la fase de diseño nadie se preocupo de averiguar que los datos que iban a ser almacenados fuesen mantenibles, es decir, que hubiera personas/procesos/sistemas encargadas de mantener la relación entre las entidades. Resultó que aunque en la teoría los elementos B se componían de elementos C, no era viable (por recursos humanos y coste) identificar a qué elemento B pertenecía cada elemento C, aunque sí era necesario almacenar los elementos C.

El diseño de datos fue cambiado por algo de este estilo:

EjemploRelacion_2

Moraleja: El modelo de datos debe ser una herramienta de almacenamiento de datos mantenible por los usuarios.

Publicado en Bases de datos, XperienciaS | 1 Comentario »

Publicidad

Google apoya la energía de renovable

Publicado por ildapena en Noviembre 28th 2007

Otra noticia sorprendente sobre Google.

molinos Google ha anunciado esta semana la decisión de dedicar una fuerte inversión a la reducción del coste de la generación de energía a partir de fuentes renovables.

El proyecto aparece con el nombre “Renewable Energy Cheaper Than Coal” y se centra tanto en energía solar, eólica y geotérmica con el objetivo de lograr hasta un gigavatio a menor precio que el carbón (una de las fuentes más empleadas hasta ahora).

Para conocer otras fuentes de energía aquí.

Fuente: reuters

Publicado en Noticias | Sin Comentarios »

Ataque phishing a gran escala contra entidades bancarias españolas

Publicado por ildapena en Noviembre 28th 2007

Desde Hispasec se anuncia un ataque phishing a gran escala contra entidades bancarias españolas que además intenta troyanizar el sistema

Al parecer, en los últimos días se están produciendo varios ataques phishing específicos contra entidades españolas especialmente agresivos a través de un kit que comprende a muchos bancos españoles. No sólo simulan ser la página del banco, sino que además intentan infectar al sistema que lo visita de una manera nada trivial.

Lo importante en este caso es que además se está intentando infectar a quien lo visita, de forma que no sólo es víctima quien introduce los datos en la página falsa. A través
de un JavaScript y según el navegador, la página intenta ejecutar código y hacerse con el sistema.

Las entidades a las que pretende simular son:

Bancaja, Banca March, Bankinter, Bankoanet, BBK, BBVANet, Banco
Guipuzcoano, Caixa Catalunya, Caixanova, Caja España, CajaMadrid,
CajaMurcia, CajaSur, Caja Mediterraneo, Caja Canarias, Caja Castilla La
Mancha, Caja Navarra, Deutsche Bank, Caixa Geral, Banco Herrero,
IberCaja, ING Direct, Kutxa, Caixa d’Estalvis Laietana, Caixa Ontinyent,
OpenBank, Caja Rural, Banco Sabadell, Solbank, Caixa Tarragona, Unicaja,
Banco Urquijo, VitalNet.

En estos momentos al menos un servidor sigue activo y casi toda su infraestructura (donde se aloja el malware) también. Hispasec recomienda no seguir ningún enlace, ni aunque se conozca que se trata de un phishing y se pretenda simplemente reportar el incidente, además de actualizar el sistema y el antivirus.

Publicado en Seguridad | Sin Comentarios »

Publicidad

El modelo de datos para un usuario

Publicado por lcflores en Noviembre 26th 2007

Xperiencias Es común encontrar la figura de un “Data Marshall” asociada a las bases de datos corporativas de las empresas. El trabajo de esta persona es definir las reglas necesarias para asegurar la máxima calidad de los datos, muchas veces a este conjunto de reglas/procedimientos tienden a denominarlo modelo de datos, algo incorrecto desde el punto de vista técnico y que puede crear algunos problemas de interpretación.

Desde un punto de vista técnico, con un modelo E/R o similar definimos una base de datos, y con la documentación de la capa de presentación deberíamos tener toda la información necesaria para el usuario. Sin embargo, no es del todo correcto.

Un sistema estándar tipo ERPs, CRMs,… etc. suele ajustarse a las medidas del cliente, pero siempre quedan cosas sin definir. Ejemplo: las famosas “línea de dirección 1”, “línea de dirección 2”… etc. ¿Qué introducimos en cada una? ¿Con mayúsculas/minúsculas? ¿Con espacios? ¿Qué idioma (no es trivial)? ¿Qué orden? ¿Con abreviaturas? ¿Cuáles?… etc. 

Las preguntas son resueltas mediante procedimientos que indican las reglas a seguir. Al conjunto de todas estas reglas muchas veces las denominan de forma incorrecta modelo de datos.

Publicado en XperienciaS | 2 Comentarios »

 
Cerrar
Enviar por Correo