Construiré un data lake de AWS y una canalización ETL usando pyspark
Ingeniero de datos en la nube que construye canalizaciones ETL escalables
Acerca de este Servicio
Como ingeniero de datos, diseño arquitecturas nativas en la nube robustas y canalizaciones ETL escalables. Ya sea procesando logs de alto volumen o construyendo Medallion Data Lakes, entrego soluciones limpias y optimizadas.
️ Lo que ofrezco:
- Canalizaciones ETL de extremo a extremo: Extracción, transformación y carga de datos automatizadas usando Python y PySpark.
- Data lakes en la nube: Arquitectura de Medallion Data Lakes sin servidor (Bronze, Silver, Gold) en AWS (S3, Glue, Athena).
- Arquitectura de bases de datos: Diseño de bases relacionales (3NF) y optimización de consultas SQL complejas (CTEs, funciones de ventana) en PostgreSQL.
- Optimización del rendimiento: Reducción de tiempos de procesamiento de datos y costos de almacenamiento usando formatos como Apache Parquet.
Pila tecnológica: AWS (S3, Glue, Athena) | PySpark | Python | PostgreSQL | SQL avanzado | Git/GitHub
¿Por qué elegirme? Escribo código listo para producción, garantizo diseños escalables y sigo estrictamente las mejores prácticas de ingeniería de datos.
Por favor, envíame un mensaje antes de ordenar para discutir tu proyecto exacto.
Mi porfolio
FAQ
Traducción automática
¿Proporcionas diagramas de arquitectura antes de comenzar el proyecto?
¡Sí! Para los paquetes Estándar y Premium, proporciono un diagrama completo de arquitectura en la nube a nivel alto (por ejemplo, flujo de AWS S3, Glue, Athena) antes de escribir el código para asegurarnos de estar en la misma página.
¿Qué tecnologías utilizas para la transformación de datos?
Principalmente uso PySpark (a través de AWS Glue) para transformaciones de big data y SQL avanzado (PostgreSQL) para motores de datos relacionales, garantizando alto rendimiento y escalabilidad.

