Construiré pipelines ETL en databricks con spark

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Urdu, Inglés

Ingeniero de datos especializado en ETL Pipelines, Databricks, Azure y Power BI

Ingeniero de datos con más de 5 años entregando pipelines ETL/ELT escalables, flujos de trabajo en Databricks, plataformas de datos en Azure, soluciones en Microsoft Fabric y dashboards en Power BI. ...

Acerca de este Servicio

Hola, soy un consultor de ingeniería de datos con más de 5 años creando pipelines de datos en producción en Databricks.

He diseñado cargas de trabajo reales en Databricks en producción, incluyendo una plataforma de datos de clientes que procesa conjuntos de datos a gran escala con PySpark, Delta Live Tables y arquitectura medallion. Trabajo en Databricks a diario, no solo como una palabra de moda.

Lo que construiré para ti:

pipelines ETL de extremo a extremo (batch o streaming)
arquitectura medallion de bronce, plata y oro
Delta Lake con ACID, evolución de esquemas, viaje en el tiempo
transformaciones PySpark optimizadas
Ingesta desde APIs, SQL Server, MySQL, Postgres, ADLS, S3, GCS, CSV, JSON, Parquet
Cargas incrementales con MERGE INTO y CDC
Autoloader, programación de trabajos, orquestación de workflows
Código limpio, modular y con control de versiones

Por qué trabajar conmigo: