Construiré pipelines ETL de spark para procesamiento por lotes y flujos de trabajo de big data

Parte de la información se ha traducido automáticamente.

Turquía

Hablo Turco, Inglés

10 pedidos completados

Soluciones escalables, código limpio y comunicación clara

¡Hola! Soy Veysi, un desarrollador de software freelance que crea soluciones potentes, sostenibles y escalables usando .NET Core, RabbitMQ, PostgreSQL y Vue.js. Con más de 4 años de experiencia en em...
Acerca de este Servicio

Diseñaré y desarrollaré pipelines ETL escalables de Spark para procesamiento de datos por lotes, transformación y flujos de trabajo de gran volumen.


Este servicio es ideal para empresas que necesitan procesar datos de archivos, bases de datos, APIs u otras fuentes estructuradas de manera confiable y fácil de mantener. Ya sea que necesites un nuevo pipeline desde cero o mejoras en un trabajo existente, puedo ayudarte a construir una solución limpia y orientada a producción.


Me enfoco en resultados prácticos de ingeniería de datos como ingestión, transformación, validación, agregación y entrega en conjuntos de datos listos para análisis o sistemas downstream.


Lo que puede incluir este servicio

  • Desarrollo de pipelines ETL con Spark o PySpark
  • procesamiento por lotes para grandes conjuntos de datos
  • ingestión de datos desde CSV, JSON, Parquet, APIs y bases de datos
  • limpieza, normalización y transformación de datos
  • lógica de joins, agregaciones, filtrado y enriquecimiento
  • salida a archivos, data warehouses o bases de datos
  • optimización y refactorización de trabajos Spark existentes
  • registro estructurado y organización de código mantenible
  • documentación básica y soporte en la entrega

Experiencia:

Integración API

Big data

Extracción de Datos

Tecnología:

apache spark

BigQuery

Python

Scala

SQL

Apache Airflow