Construiré pipelines de datos escalables usando dagster, AWS, postgresql y redshift

Parte de la información se ha traducido automáticamente.

Alemania

Hablo Inglés
Con más de 8 años de experiencia en diseñar soluciones de datos de extremo a extremo, destaco en diseñar y optimizar pipelines de datos para análisis, modelado predictivo y ETL dentro de marcos ágiles...
Acerca de este Servicio

¿Buscas un ingeniero de datos confiable para construir pipelines de datos escalables y de grado de producción?

Me especializo en construir plataformas de datos modernas usando:

  • Dagster (orquestación de workflows y pipelines basados en assets)
  • PostgreSQL (base de datos fuente y de metadatos)
  • Amazon S3 (almacenamiento de data lake)
  • Amazon Redshift (almacén de análisis)
  • Python (desarrollo ETL/ELT)


Lo que puedo hacer por ti

Construir pipelines ETL/ELT de extremo a extremo

Diseñar assets y jobs en Dagster

Cargar datos desde APIs / bases de datos S3 Redshift

Implementar pipelines incrementales (CDC, watermarking)

Optimizar el rendimiento para millones de registros

Manejar evolución de esquemas y validación de datos

Configurar particiones de datos (diarias/hora)

Crear arquitectura de data lake basada en S3

Depurar y arreglar pipelines existentes


Mi experiencia incluye

  • pipelines multi-asset en Dagster
  • Migración de PostgreSQL a Redshift
  • Particionado en S3 Parquet
  • Cargas incrementales (sin duplicados)
  • Ingesta de datos a gran escala (millones de filas)
  • Calidad y validación de datos
  • Pruebas unitarias y de integración
  • Manejo de errores y reintentos


Enfoque listo para producción

Sigo las mejores prácticas de la industria:

  • Estructura modular del código
  • Registro y monitoreo
  • Reintentos y manejo de fallos
  • Pipelines idempotentes
  • Diseño listo para CI/CD

Proveedor de la nube:

Amazon Web Services

Experiencia:

Instalación

Implementación

Migración

Marcos:

Terraform

Ansible

Etiquetas relacionadas