Seré tu experto en databricks y pyspark para pipelines de ETL
Ingeniero senior de datos y AI, certificado en Databricks, 11 años
Acerca de este Servicio
¿Necesitas pipelines de Databricks a prueba de fallos que no se rompan a las 3 de la mañana? Estás en el lugar correcto.
Soy un ingeniero de datos certificado en Databricks (Profesional) con más de 10 años creando sistemas de datos en producción para empresas de comercio de energía, banca, retail y análisis de criptomonedas, incluyendo OVO Energy, Bank of America y Sainsbury's.
Lo que construiré para ti:
- ️Pipelines escalables en PySpark / Scala Spark en Databricks
- Arquitectura DeltaLake (medallón de bronce/plata/oro)
- ETL en streaming y batch con Kafka, Auto Loader o Structured Streaming
- Configuraciones de clúster optimizadas en costos (he entregado más de 80 mil libras en ahorros anuales en la nube)
- Código limpio, probado y documentado que puedes entregar a tu equipo
Mi stack: Databricks, PySpark, Scala, DeltaLake, Airflow, Kafka, Snowflake, BigQuery, Terraform, AWS, GCP.
Mi proceso: Llamada de descubrimiento -> aprobación de arquitectura -> construcción -> prueba -> revisión -> entrega. Sin sorpresas, sin aumento de alcance.
Envíame un mensaje antes de ordenar para que pueda definir bien tu proyecto y confirmar que encaja. Respondo en menos de 1 hora durante el horario laboral del Reino Unido.
Construyamos algo sólido.
FAQ
Traducción automática
¿Qué información necesitas para empezar?
Ubicación y formato de los datos fuente, destino objetivo, datos de muestra (anónimos están bien), estimaciones de volumen y requisitos de SLA. Enviaré una plantilla de breve resumen después de la orden.
¿Puedes trabajar con mi configuración en la nube existente?
Sí — Trabajo con Databricks alojado en AWS, GCP y Azure. Trabajaré dentro de tu entorno usando credenciales de solo lectura que tú proporciones.
¿Firma NDA?
Por supuesto. Envíame tu NDA antes de ordenar y lo revisaré y firmaré.
¿Qué pasa si aún no tengo datos?
No hay problema — Puedo simular datos realistas para desarrollo y tú puedes reemplazarlos por datos de producción después.
¿Manejas pipelines de streaming en tiempo real?
Sí — Las integraciones con Structured Streaming, Auto Loader y Kafka son fortalezas principales.
¿Qué pasa después del parto?
Recibirás una demostración (llamada o Loom), todo el código fuente, README y 14 días de soporte por correo electrónico para consultas. La opción premium incluye una llamada de entrega de 30 minutos.
¿Qué soporte obtengo después de la entrega?
Cada pedido incluye 14 días de soporte por email — respondo tus preguntas en 24 horas, y si algo que construí no funciona como se especificó, lo arreglaré rápidamente sin costo adicional. El paquete Premium añade una llamada de entrega de 30 minutos para que tú y tu equipo puedan manejar y ampliar el trabajo con total confianza.

