Configuraré el Unity catalog de databricks, capas medallón y pipelines ETL en pyspark

Parte de la información se ha traducido automáticamente.

Vetted Pro

Pakistán

Hablo Urdu, Inglés, Hindi, Polaco

7 pedidos completados

Ingeniero de datos, desarrollador de Python, automatización con IA y agentes de IA

Líder en arquitectura de datos y ingeniero de datos senior con más de 6 años ayudando a empresas a diseñar, escalar y estabilizar sus plataformas de datos. Trabajo con compañías para convertir datos ...
Revisado por el equipo de Fiverr Pro

El equipo de Fiverr Pro seleccionó a Hamza Anwar por su experiencia.

Revisado para

  • Ingeniería de datos

Acerca de este Servicio

Vetted Pro

La mayoría de los proyectos de data lake fracasan en Silver. Los datos en bruto llegan a Bronze y simplemente permanecen allí desordenados, no confiables, inutilizables. Construyo todo el pipeline desde la ingestión de datos en bruto hasta una capa Gold que tus herramientas de BI puedan consultar realmente.


Soy un ingeniero de datos en Python con experiencia práctica en Databricks que cubre toda la pila del lakehouse con arquitectura medallón, pipelines PySpark, Delta Lake, Unity Catalog y Databricks Workflows. También tengo una maestría en Business Intelligence, así que entiendo cómo deben lucir los datos en la capa Gold para que los informes funcionen realmente.


Lo que construiré para ti:

  1. Arquitectura medallón (Bronze / Silver / Gold) diseñada en torno a tus fuentes de datos y lógica de negocio
  2. Notebooks de PySpark documentados, probados y listos para producción.
  3. Tablas Delta con particionado adecuado, Z-ordering y vacuuming.
  4. Configuración de Unity Catalog con esquemas, catálogos y políticas de acceso.
  5. Databricks Workflows para programar, monitorear y reintentar tus pipelines automáticamente.
  6. Capa Gold lista para BI que tu equipo puede consultar desde el primer día.


No estás seguro de qué necesitas? Envíame tus fuentes de datos y tu objetivo final y te diré exactamente qué tiene sentido construir.

Plataforma de almacenes:

Databricks

Tipo de proyecto:

Nueva creación

Clientes con los cuales he trabajado
Acuity Healthcare

Acuity Healthcare

Built an automated healthcare executive leads pipeline in Python that scrapes Indeed, enriches contacts via Apollo, anymailfinder, verifies emails through Million Verifier, and delivers 2,000 job-matched leads per batch to Excel.

mar 2026-may 2026

Mi porfolio

Otros servicios de Ingeniería de datos que ofrezco

Etiquetas relacionadas