Construiré pipelines de datos de extremo a extremo en GCP usando pubsub, kafka y dataform

Parte de la información se ha traducido automáticamente.

India

Hablo Inglés, Hindi
Soy Arpit, graduado en IIT M.Tech y Ingeniero de Datos Certificado en GCP, especializado en diseñar soluciones escalables y de alto impacto. Con más de 4 años de experiencia en ingeniería de datos, de...
Acerca de este Servicio

Una plataforma de datos moderna requiere una ingesta robusta y análisis modelados con precisión. Como ingeniero de datos certificado en Google Cloud, construyo sistemas de extremo a extremo que garantizan la integridad de los datos desde la fuente hasta el panel de control.


Diseño pipelines impulsados por eventos de alto volumen con una entrega estricta de al menos una vez, mientras creo modelos centralizados en BigQuery que unifican tablas dispares de más de 19 unidades de negocio.


Lo que puedo hacer por ti:

  • Ingesta en tiempo real: Diseñar sistemas seguros usando Apache Kafka y GCP Pub/Sub en Java Spring Boot.
  • Procesamiento sin servidor: Crear microservicios desacoplados con Cloud Run para transformar grandes conjuntos de datos.
  • Modelado dimensional: Convertir datos crudos de BigQuery en esquemas estrella usando Dataform, aplicando SCD Tipo 2 y 4.
  • Orquestación: Coordinar flujos de trabajo ELT en varias etapas con Cloud Composer (Airflow) para automatizar trabajos de Dataform.


Tecnologías que uso: GCP Pub/Sub, Kafka, BigQuery, Dataform, Java (Spring Boot), Cloud Run, Airflow y Terraform.


¿Por qué elegirme? Obtén un experto en la nube certificado que implementa marcos sólidos de calidad de datos, registrando fallos de afirmación en tablas de errores persistentes para que tus análisis sigan siendo confiables.


Hablemos antes de que hagas tu pedido para definir el alcance.

Plataforma de destino:

Google BigQuery

Databricks Lakehouse

Herramientas y plataformas:

Fivetran

Airbyte

Etiquetas relacionadas