Construiré una tubería de datos ETL personalizada usando python y apache airflow

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Inglés

Ingeniero de datos, pipelines ETL, experto en Spark y data warehouse en la nube

Ingeniero de datos | Más de 4 años creando pipelines ETL, data warehouses y sistemas de streaming en tiempo real. Experto en Python, Apache Airflow, Apache Spark, dbt, Snowflake, BigQuery, Amazon Reds...
Acerca de este Servicio

¿Tienes problemas con transferencias manuales de datos, scripts rotos o tuberías de datos poco confiables? Te construiré una tubería ETL lista para producción que extrae, transforma y carga tus datos automáticamente, ahorrándote horas de trabajo manual cada semana.


Lo que entrego:

- Tubería ETL personalizada creada en Python con código limpio y documentado

- DAG de Apache Airflow para programación y monitoreo automatizados

- Soporte para todas las principales fuentes de datos: bases de datos (PostgreSQL, MySQL), APIs, CSV/Excel, S3, Google Sheets

- Lógica de transformación y limpieza de datos adaptada a tus reglas de negocio

- Manejo de errores, lógica de reintentos y alertas por email/Slack en caso de fallos

- Despliegue en tu infraestructura en la nube (AWS, GCP, Azure) o en servidor local

- Documentación completa para que tu equipo pueda mantenerla de forma independiente


Tecnologías que uso: Python, Apache Airflow, Apache Spark, Pandas, SQLAlchemy, AWS Glue, AWS Lambda, S3, PostgreSQL, MySQL, BigQuery, Snowflake.


Para quién es esto:

- Startups que están creando su primera tubería de datos automatizada

- Empresas que migran de flujos de trabajo manual en Excel/CSV a ETL automatizado

- Equipos que reemplazan una tubería de datos legacy rota o lenta

- Compañías que necesitan una tubería de ingesta de datos para Snowflake o BigQuery


Plataforma de destino:

Snowflake

Amazon Redshift

Herramientas y plataformas:

Airbyte

AWS Glue DataBrew

Mi porfolio