Construiré una canalización de datos ETL automatizada usando Python y Airflow
Data Scientist junior, ingeniero de ML, Python, pipelines ETL
Acerca de este Servicio
¿Tus datos están en APIs o archivos sin una forma automatizada de recopilarlos y almacenarlos? Construyo canalizaciones ETL listas para producción usando Apache Airflow 3 y Python que extraen, transforman y cargan tus datos en un horario, completamente automatizadas, sin trabajo manual.
Lo que entrego:
- Canalización automatizada con tareas independientes de extracción, transformación y carga
- Apache Airflow 3 con API TaskFlow y programación diaria
- Pila de Docker con múltiples contenedores para una implementación limpia y reproducible
- Base de datos PostgreSQL con registros estructurados y consultables
- Código fuente completo entregado vía GitHub
¿Por qué yo? Tengo una publicación revisada por pares en una conferencia IEEE, doble certificación en DataCamp (Data Scientist certificado y Associate Data Scientist certificado), y una pasantía de investigación en un laboratorio de IA en Reino Unido. Mi canalización ETL funciona en producción en vivo, acumulando más de 365 registros estructurados al año sin intervención manual.
Trabajo con: APIs REST y fuentes de datos basadas en archivos, cargando en PostgreSQL.
Nota: Por favor, envíame un mensaje antes de ordenar para discutir tu fuente de datos y requisitos.
Plataforma de destino:
Postgresql
•
mySQL
Herramientas y plataformas:
Otros
Mi porfolio
FAQ
Traducción automática
¿A qué fuentes de datos puedes conectarte?
Actualmente APIs REST. Si tienes una fuente diferente como archivos CSV o una base de datos, envíame un mensaje primero y podemos discutir la viabilidad.
¿Necesito tener Apache Airflow ya instalado?
No. Configuraré el entorno de la canalización por ti, incluyendo la configuración de Docker si es necesario.
¿La canalización se ejecutará automáticamente sin que tenga que hacer nada?
Sí. Los paquetes Estándar y Premium incluyen automatización totalmente programada usando Apache Airflow que se ejecuta en tu horario definido sin necesidad de activación manual.
¿Recibiré el código fuente?
Sí, todos los paquetes incluyen el código fuente completo en Python y los archivos DAG.
¿Puedes trabajar con mi base de datos existente?
Sí, siempre que puedas proporcionar las credenciales de conexión de forma segura. Recomiendo discutir esto antes de ordenar.

