¿Qué es un data pipeline?
What is a data pipeline?
A series of steps that moves data from a source to a destination, cleaning and transforming it on the way. Like a water pipe — raw input goes in, treated output comes out, and you can trust what arrives.
Un data pipeline es una secuencia de pasos que mueven datos de un lugar a otro, transformándolos en el camino. Imagínalo como una tubería real que lleva agua desde una presa hasta tu casa. En el camino, el agua se filtra, se trata y se presuriza para llegar limpia y usable.
En Data Engineering aplica la misma idea a los datos. Datos crudos entran desde fuentes (APIs, bases de datos, archivos), pasan por limpieza y transformación, y aterrizan en un destino donde analistas y aplicaciones los usan. Construir pipelines confiables es el trabajo central de un Data Engineer.