Parece que este servicio está en espera
Desarrollaré pipelines ETL en Azure usando Databricks
Estados Unidos
54 pedidos completados
Corregir bug en código y repetir
Acerca de este Servicio
Ofrezco desarrollo básico de pipelines ETL usando Azure Databricks y Apache Spark. Este servicio es adecuado para cargas de datos pequeñas a medianas y para implementaciones de aprendizaje o prototipo.
Lo que hago:
- Construir pipelines ETL usando PySpark / Spark SQL
- Leer datos desde Azure Data Lake, Blob Storage o fuentes SQL
- Aplicar transformaciones (filtrado, joins, agregaciones, limpieza de datos)
- Cargar los datos procesados en Delta Lake o Azure SQL
- Crear notebooks de Databricks limpios y bien estructurados
- Validación básica y código Spark optimizado para rendimiento
Pila tecnológica:
- Azure Databricks
- Apache Spark (PySpark, Spark SQL)
- Azure Data Lake / Blob Storage
- Delta Lake
Más adecuado para flujos de trabajo ETL básicos, preparación de datos y proyectos de práctica en Databricks.
Envíame un mensaje antes de ordenar para confirmar las fuentes de datos y los requisitos.
Experiencia:
Big data
•
Extracción de Datos
•
Validación de Datos
•
etl
Tecnología:
Python
•
Databricks
FAQ
Traducción automática
¿Proporcionas recursos de Azure?
No. El comprador debe proporcionar acceso a Azure Databricks, almacenamiento y las fuentes de datos necesarias.
¿Qué fuentes de datos admitís?
Azure Data Lake, Azure Blob Storage, Azure SQL Database y archivos planos (CSV, Parquet, JSON).
¿Qué lenguaje de programación utilizas?
Principalmente PySpark y Spark SQL en Azure Databricks.
¿Recibiré los notebooks de Databricks?
Sí. Todos los notebooks creados durante el proyecto serán compartidos.
¿Debo comunicarme con usted antes de realizar el pedido?
Sí. Por favor, envíame un mensaje primero para confirmar requisitos, fuentes de datos y acceso.

