Construiré un data lake de AWS y una canalización ETL usando pyspark

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Inglés

Ingeniero de datos en la nube que construye canalizaciones ETL escalables

Hola, soy un ingeniero de datos independiente especializado en construir canalizaciones ETL escalables y arquitecturas de datos en la nube robustas. Ayudo a las empresas a transformar logs desordenado...
Acerca de este Servicio

Como ingeniero de datos, diseño arquitecturas nativas en la nube robustas y canalizaciones ETL escalables. Ya sea procesando logs de alto volumen o construyendo Medallion Data Lakes, entrego soluciones limpias y optimizadas.

Lo que ofrezco:

  • Canalizaciones ETL de extremo a extremo: Extracción, transformación y carga de datos automatizadas usando Python y PySpark.
  • Data lakes en la nube: Arquitectura de Medallion Data Lakes sin servidor (Bronze, Silver, Gold) en AWS (S3, Glue, Athena).
  • Arquitectura de bases de datos: Diseño de bases relacionales (3NF) y optimización de consultas SQL complejas (CTEs, funciones de ventana) en PostgreSQL.
  • Optimización del rendimiento: Reducción de tiempos de procesamiento de datos y costos de almacenamiento usando formatos como Apache Parquet.

Pila tecnológica: AWS (S3, Glue, Athena) | PySpark | Python | PostgreSQL | SQL avanzado | Git/GitHub

¿Por qué elegirme? Escribo código listo para producción, garantizo diseños escalables y sigo estrictamente las mejores prácticas de ingeniería de datos.

Por favor, envíame un mensaje antes de ordenar para discutir tu proyecto exacto.

Idioma:

Inglés

Urdu

Experiencia técnica:

dbt (herramienta de modelado de datos)

Experiencia:

Canalización de datos

Desarrollo ETL

industria:

Análisis de Datos

Mi porfolio