Construiré pipelines de datos expertos en pyspark con databricks y delta lake
Acerca de este Servicio
pipelines de datos escalables con PySpark, Databricks y Delta Lake
¿Cansado de pipelines de datos lentos, no optimizados o poco confiables? Como un ingeniero de datos profesional con más de 3.5 años de experiencia, me especializo en diseñar soluciones ETL/ELT de alto rendimiento. Ayudo a las empresas a transformar datos fragmentados en conjuntos de datos limpios y listos para producción usando la arquitectura moderna Lakehouse.
Mi experiencia técnica:
- PySpark y Databricks: Desarrollo de lógica de procesamiento distribuido complejo para big data.
- Delta Lake: Implementación de transacciones ACID, cumplimiento de esquemas y viajes en el tiempo para almacenamiento confiable.
- Orquestación de flujos de trabajo: Automatización experta usando Azure Data Factory (ADF), Apache Airflow y Azure Functions sin servidor.
- Infraestructura en la nube: Experiencia práctica con Azure, MinIO y optimización de SQL de alto rendimiento.
¿Por qué trabajar conmigo?
Me concentro en estabilidad arquitectónica y eficiencia en el cómputo. Mi experiencia en integraciones complejas de ERP e investigación en ingeniería de datos garantiza que tus pipelines estén diseñados para escalabilidad a largo plazo, no solo una solución rápida.
Por favor, envíame un mensaje antes de hacer un pedido. Cada proyecto de datos tiene requisitos únicos, y una alineación técnica breve es esencial para ofrecer la mayor precisión.
