Construiré una canalización de datos ETL automatizada usando Python y Airflow

Parte de la información se ha traducido automáticamente.

Bangladesh

Hablo Bengalí, Inglés

Data Scientist junior, ingeniero de ML, Python, pipelines ETL

Soy Data Scientist e Ingeniero de Datos, recién graduado de AIUB (CGPA: 3.98/4.00), con una publicación revisada por pares en IEEE y doble certificación en DataCamp — Data Scientist Certificado y Asso...
Acerca de este Servicio

¿Tus datos están en APIs o archivos sin una forma automatizada de recopilarlos y almacenarlos? Construyo canalizaciones ETL listas para producción usando Apache Airflow 3 y Python que extraen, transforman y cargan tus datos en un horario, completamente automatizadas, sin trabajo manual.


Lo que entrego:

  • Canalización automatizada con tareas independientes de extracción, transformación y carga
  • Apache Airflow 3 con API TaskFlow y programación diaria
  • Pila de Docker con múltiples contenedores para una implementación limpia y reproducible
  • Base de datos PostgreSQL con registros estructurados y consultables
  • Código fuente completo entregado vía GitHub


¿Por qué yo? Tengo una publicación revisada por pares en una conferencia IEEE, doble certificación en DataCamp (Data Scientist certificado y Associate Data Scientist certificado), y una pasantía de investigación en un laboratorio de IA en Reino Unido. Mi canalización ETL funciona en producción en vivo, acumulando más de 365 registros estructurados al año sin intervención manual.


Trabajo con: APIs REST y fuentes de datos basadas en archivos, cargando en PostgreSQL.


Nota: Por favor, envíame un mensaje antes de ordenar para discutir tu fuente de datos y requisitos.

Plataforma de destino:

Postgresql

mySQL

Herramientas y plataformas:

Otros

Mi porfolio