¿Por qué usar un data warehouse?
Why not just run analytics queries on the production database?
Production databases are tuned for fast single-row operations, not for scanning millions of rows for a report. Heavy analytics queries slow the app for real users. A data warehouse is a separate columnar store built specifically for fast aggregations over huge datasets.
Las bases de datos operacionales (Postgres, MySQL) están optimizadas para lecturas y escrituras rápidas de filas individuales — lo que tu app necesita para cargar un perfil de usuario o guardar una orden. Correr queries analíticas pesadas contra ellas ralentiza la app y produce reportes lentos.
Un data warehouse es una base de datos separada, columnar, optimizada para queries analíticas sobre datasets grandes. Copias datos hacia él de forma programada, y los analistas lo consultan sin tocar producción. Snowflake, BigQuery y Redshift son las opciones más comunes.