Construiré pipelines de datos escalables con spark o pyspark
Acerca de este Servicio
¿Te cuesta manejar procesamiento de datos a gran escala o pipelines ETL lentos?
Soy ingeniero de datos con más de 5 años de experiencia creando pipelines de datos de alto rendimiento para sistemas fintech que procesan millones de transacciones diarias.
Puedo ayudarte a diseñar, construir y optimizar pipelines de datos escalables usando tecnologías modernas de big data.
Servicios que ofrezco:
Construcción de pipelines ETL usando Spark / PySpark
Streams con Kafka
Procesamiento de datos en batch y en tiempo real
Optimización de pipelines de datos
Ingesta de datos desde APIs, bases de datos o archivos
Integración con data warehouse
Tecnologías:
Spark | PySpark | Kafka | Scala | Hive | BigQuery | BigTable | SQL | GCP | Azure
¿Por qué elegirme?
Pipelines de nivel de producción
Optimizado para grandes conjuntos de datos
Código limpio y escalable
Comunicación rápida
