Diseñaré e implementaré pipelines de ingeniería de datos escalables.
Científico de datos, ingeniero de Big Data y AI, soluciones de principio a fin
Acerca de este Servicio
¿Por qué trabajar conmigo?
¿Necesitas pipelines de datos confiables y de baja latencia, y una plataforma de datos limpia y consultable? Ayudo a personas y pequeños equipos a convertir flujos y archivos desordenados en datos listos para producción que alimentan dashboards, modelos de ML e informes de negocio. Tengo un máster en Ciencia de Datos y Sistemas Inteligentes y una formación en ingeniería. Diseño pipelines que reducen el trabajo manual, ahorran costos en la nube y entregan datos frescos y confiables. Incluso si necesitas diseñar arquitecturas en batch o en tiempo real, estoy aquí para ayudarte a hacer realidad tus ideas.
Nota: Si quieres ver mi portafolio detallado, envíame un mensaje y te enviaré el enlace.
¿Qué servicios ofrezco?
- End-to-end ETL/ELT pipelines (batch y streaming)
- Arquitectura de streaming en tiempo real (Kafka, Spark Structured Streaming)
- Diseño de data lake / Lakehouse (capas de medallón bronze, silver, gold)
- Integración de datos: APIs, bases de datos, S3/GCS, message brokers
- Verificación automática de calidad de datos, monitoreo y alertas
- Particionado de datos, compactación y optimización de costos/latencia
Herramientas y tecnologías
Python, Apache Spark, Kafka, Delta Lake, Databricks, Airflow, AWS (S3), GCP, PostgreSQL, MongoDB, Parquet/Avro, Docker, conceptos básicos de CI/CD
Mi porfolio
FAQ
Traducción automática
¿Qué debo proporcionar?
Por favor comparte tus muestras de datos en bruto (CSV, JSON, acceso a bases de datos, etc.), una descripción de los resultados deseados y cualquier preferencia tecnológica. Cuantos más detalles brindes sobre tus datos y objetivos, mejor será la solución.
¿Qué tecnologías utilizarás?
Normalmente uso Apache Spark (PySpark), Kafka para streaming, Delta Lake/S3 o HDFS para almacenamiento, y SQL/Python para transformaciones. Avísame si tienes preferencias específicas (por ejemplo, herramientas de AWS, GCP o Azure).
¿Qué es el tiempo de respuesta?
La entrega depende del alcance del proyecto. Los paquetes anteriores ofrecen tiempos estimados, pero acordaremos las fechas exactas una vez revise tus requisitos.
¿Qué pasa si no estoy satisfecho?
La satisfacción del cliente es mi prioridad. Cada paquete incluye revisiones (como se indica). Si algo no está bien, trabajaré contigo para corregirlo.
