Construiré y optimizaré pipelines escalables de databricks delta lake.
Ingeniería de datos, Azure, AWS, Databricks, Lakehouse, Spark, Fabric
Acerca de este Servicio
Ingeniero de datos senior certificado por Microsoft y Databricks (más de 9 años de experiencia)
Deja de luchar con datos desordenados. Construye un Lakehouse de nivel empresarial que escala. Como experto con doble certificación, diseño y optimizo plataformas de datos listas para producción en AWS, Azure y Databricks.
Lo que entrego:
- Arquitectura Medallion: Implementación completa de las capas Bronze, Silver y Gold para la integridad de los datos.
- Canalizaciones escalables: ETL/ELT en batch y streaming de alto rendimiento usando PySpark y Spark SQL.
- Ecossistema Databricks: Dominio de Unity Catalog (Gobernanza), Delta Live Tables (DLT) y Asset Bundles (DABs).
- Integración en la nube: Configuración experta para AWS (S3, Glue, EMR, Athena) y Azure (Fabric, ADF, Synapse, OneLake).
- Optimización de costos: Ajustes avanzados (Z-Order, Liquid Clustering) para reducir tus gastos en cloud computing.
- Datos listos para IA: Preparación especializada de datos para GenAI, chatbots RAG y Mosaic AI.
¿Por qué trabajar conmigo?
- Más de 9 años de experiencia: Amplio conocimiento en entornos de datos complejos a escala empresarial.
- De nivel producción: Código limpio, bien documentado y altamente mantenible.
- Enfoque en rendimiento: Sistemas optimizados para consultas en menos de un segundo y máxima eficiencia.
- Transforma tus datos en un activo estratégico. Contáctame hoy
Mi porfolio
FAQ
Traducción automática
¿Qué tipos de proyectos manejas?
Me encargo de pipelines ETL, arquitectura de data lake/lakehouse, migración a la nube, optimización de datos y pipelines de análisis.
¿Con qué plataformas en la nube trabajáis?
AWS, Azure y Databricks.
¿Trabajas con datos por lotes y en streaming?
Sí, trabajo con pipelines de datos por lotes, casi en tiempo real y en streaming.
¿Qué herramientas y tecnologías usas?
PySpark, Spark SQL, Azure Data Factory, AWS Glue, Databricks, EMR, Synapse y más.
¿Puedes optimizar pipelines existentes?
Sí, me especializo en ajuste de rendimiento y optimización de costos.
¿Proporcionas documentación?
Sí, se incluye documentación técnica clara.
¿Puedes integrar múltiples fuentes de datos?
Por supuesto — APIs, bases de datos, almacenamiento en la nube y archivos planos.
¿Apoyas proyectos a largo plazo?
Sí, estoy abierto a apoyos a largo plazo y soporte continuo.
¿Mis datos estarán seguros?
Sí. Sigo las mejores prácticas de la industria en seguridad de datos y control de acceso.
¿Trabajas con conjuntos de datos grandes?
Sí, manejo regularmente millones a miles de millones de registros.

