Construiré pipelines de big data y procesaré conjuntos de datos usando pyspark y sql

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Inglés, Francés

Ingeniero en IA, Datos y Web3

Soy ingeniero en ML y Data con un máster en Data e Inteligencia por la Université Claude Bernard Lyon 1. Me especializo en cerrar la brecha entre la investigación avanzada en IA y el software escalabl...
Acerca de este Servicio

¿Luchas con conjuntos de datos masivos o tiempos de procesamiento lentos?


Soy ingeniero de datos especializado en procesamiento de Big Data a gran escala, ETL y análisis. Construyo pipelines de datos altamente optimizados para ingerir, limpiar y transformar gigabytes de datos de manera eficiente usando PySpark y Python. Ya sea que necesites agregaciones complejas, mapeo geoespacial o visualizaciones limpias, entrego código listo para producción.


Mis servicios principales:


  • Pipelines de Big Data: Flujos de trabajo ETL de alto rendimiento usando Apache Spark, PySpark y Python.
  • Transformaciones avanzadas: Consultas Spark SQL optimizadas, funciones de ventana complejas, UDFs y joins a gran escala.
  • Integración de datos: Limpieza y formateo de datos estructurados/semi-estructurados para análisis posteriores.
  • Datos geoespaciales: Procesamiento de datos basados en ubicación y series temporales.
  • Visualización de insights: Convertir big data en visualizaciones accionables usando Pandas y Matplotlib.


Pila tecnológica: Python | Apache Spark | PySpark | Spark SQL | Pandas | Matplotlib


¿Por qué elegirme?

Escribo código limpio, escalable y completamente documentado, asegurando que tus operaciones de datos sean precisas y optimizadas en términos de cálculo.


Por favor, envíame un mensaje antes de ordenar para discutir tu conjunto de datos.

Plataforma de destino:

Databricks Lakehouse

Postgresql

Herramientas y plataformas:

Otros