Parece que este servicio está en espera

Desarrollaré pipelines ETL en Azure usando Databricks

Parte de la información se ha traducido automáticamente.

Estados Unidos

Hablo Urdu, Inglés

54 pedidos completados

Corregir bug en código y repetir

Soy un ninja de la programación que tiene la pasión suficiente para cumplir cualquier trabajo con total satisfacción de los requisitos y mejorar su calidad analizando el trabajo en general. Como gradu...
Acerca de este Servicio

Ofrezco desarrollo básico de pipelines ETL usando Azure Databricks y Apache Spark. Este servicio es adecuado para cargas de datos pequeñas a medianas y para implementaciones de aprendizaje o prototipo.

Lo que hago:

  • Construir pipelines ETL usando PySpark / Spark SQL
  • Leer datos desde Azure Data Lake, Blob Storage o fuentes SQL
  • Aplicar transformaciones (filtrado, joins, agregaciones, limpieza de datos)
  • Cargar los datos procesados en Delta Lake o Azure SQL
  • Crear notebooks de Databricks limpios y bien estructurados
  • Validación básica y código Spark optimizado para rendimiento

Pila tecnológica:

  • Azure Databricks
  • Apache Spark (PySpark, Spark SQL)
  • Azure Data Lake / Blob Storage
  • Delta Lake

Más adecuado para flujos de trabajo ETL básicos, preparación de datos y proyectos de práctica en Databricks.

Envíame un mensaje antes de ordenar para confirmar las fuentes de datos y los requisitos.

Experiencia:

Big data

Extracción de Datos

Validación de Datos

etl

Tecnología:

Python

Databricks

Etiquetas relacionadas