- Dataflows. Permiten crear flujos de transformaciones que resultan en 1 o más datasets.
- Recipes. Permite crear 1 dataset combinando datos y haciendo pequeñas transformaciones.

Trabajando con Dataflows y Recipes: ¿pero dónde están los joins?

Antes de trabajar con EA, yo había estado trabajando con herramientas ETL. Y cuando empecé a trabajar con EA y vi la parte de preparación de datos, me quedé muy decepcionada, porque había muy pocas trasnformaciones.
Lo primero que eché en falta a la hora de preparar los datos en EA con dataflows (¡y recipes!!!) fue la falta de poder combinarlos mediante joins 😲😱. Solo se podían unir los datos mediante transformaciones llamadas "augment", que hacen justamente lo que su nombre indica. ¡Pero nada tiene que ver con un join! Hay que leer muy bien la documentación para saber al detalle el uso (cosa que es fundamental). Cuando entiendes cómo funciona un augment es cuando puedes empezar a combinar los datos.
El que no haya habido la posibilidad de preparar datos mediante joins es algo que me ha limitado bastante en varias ocasiones.
¿Dataflows o recipes?

Con el tiempo, el conocimiento y la ayuda de muchas personas en la comunidad, he llegado a hacer grandes transformaciones con los dataflows.
Pero también me he dado cuenta de que los dataflows y las recipes NO son herramientas ETL, aunque te pueden llegar a facilitar muchas cosas. EA es una herramienta de análisis (y de IA: "augmented BI"). Pero si trabajas con gran cantidad de datos que requieran de limpieza o de grandes transformaciones para poderlos analizar, lo mejor es construir una "plataforma de datos" (Data Customer Platform) previa al análisis.
Nueva herramienta de preparación de datos: Data Prep
En la release Summer '19 apareció una gran novedad: los joins (agosto de 2019). A mí lo que me sorprendió es que este cambio apareciese en la herramienta de recipes y no como transformación en los datataflows. Esto quería decir que se estaba apostando por esta herramienta (recipes) y que podría ser que los dataflows perdieran peso.

La herramienta de recipes pasó a llamarse "Data Prep" en la summer '19.

Además, en esta keynote del pasado Dreamforce (aproximadamente en el minuto 36), se puede ver la siguiente imagen:

Así pues, parece que en breve veremos nuevos grandes cambios en Data Prep.
Comentarios
Publicar un comentario
Deja aquí tu comentario