Crearé y optimizaré scripts de pyspark, hive y sqoop

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Inglés

59 pedidos completados

Experto

Me esfuerzo continuamente por perfeccionar mis habilidades en el desarrollo lógico, un aspecto vital de cualquier esfuerzo profesional. La eficiencia y la gestión eficaz no son sólo mis áreas de espec...
Acerca de este Servicio

Déjame ayudarte a convertir datos desordenados en pipelines rápidos, estructurados y confiables.

  • Contáctame antes de hacer un pedido para discutir tu caso de uso.


Ofrezco servicios profesionales de ingeniería de datos usando Apache Spark (PySpark), Hive y Sqoop, especializándome en:

  • ETL Pipelines con PySpark Limpiar, transformar y enriquecer datos
  • Optimización de Hive Particionamiento eficiente, bucketing y ajuste de consultas
  • Scripts de Sqoop Importar/exportar datos entre RDBMS y Hadoop
  • Optimización de trabajos Mejorar rendimiento y reducir tiempos de ejecución
  • Pipeline de ingestión de datos personalizado Estructurado para procesamiento por lotes o programación
  • Diseño de esquemas y conversión de formatos de datos Avro, Parquet, ORC

Lo que entrego:

  • Scripts de PySpark con código modular y limpio
  • Scripts de HiveQL con consultas optimizadas
  • Comandos de Sqoop para transferencia eficiente de datos
  • Documentación (a solicitud)
  • Soporte para despliegue y depuración

¿Por qué elegirme?

  • Más de 7 años en el ecosistema Big Data
  • Experiencia en producción con Spark en grandes conjuntos de datos
  • Código limpio, reutilizable y con comentarios en línea
  • Entrega puntual y comunicación clara

Extras (Disponibles en Planes Premium):

  • Soporte para programación (Oozie)
  • Pruebas unitarias e integración de logs
  • Refactorización de código y revisión del rendimiento de trabajos

Idioma:

Inglés

Hindi

Urdu

Experiencia técnica:

Informática

apache spark

Databricks

hadoop

Experiencia:

Canalización de datos

Desarrollo ETL

industria:

Arte y diseño

Audio y video

Análisis de Datos