¿Buscas automatizar tus flujos de trabajo de datos? Me especializo en construir pipelines ETL escalables y rentables usando Python y AWS, transformando tus datos en insights útiles.
Lo que puedo hacer por ti:
- Trabajos en AWS Glue: Desarrollar scripts ETL robustos usando PySpark para procesamiento de datos a gran escala o Python Shell para integraciones ligeras.
- Pipelines sin servidor: Crear flujos de trabajo impulsados por eventos con AWS Lambda y triggers en S3.
- Orquestación de datos: Configurar y gestionar flujos de trabajo con AWS Step Functions o Glue Workflows.
- Carga de datos: Cargar datos de manera eficiente en Amazon Redshift, S3 (Data Lakes) o RDS.
- Integración con API: Extraer datos de APIs de terceros usando Python y almacenarlos de forma segura en AWS.
- Optimización: Ajustar y mejorar los trabajos en Glue existentes para reducir costos en DPU (unidad de procesamiento de datos).