limpiaré y automatizaré tus datos como ingeniero de datos
Acerca de este Servicio
Voy a limpiar, formatear y transformar conjuntos de datos desde unas pocas miles de filas hasta decenas de millones de filas de manera eficiente usando Python y PySpark para un análisis preciso.
Eliminar nulos y duplicados
Estandarizar texto, fechas y números
Trabajar con CSV, Excel y JSON (planos/semi-estructurados)
Automatización con Python/PySpark para mayor eficiencia
Con mi experiencia en Data Engineering, tus datos serán consistentes, precisos y listos para el análisis.
Plataforma de almacenes:
Azure Synapse
•
Databricks
Tipo de proyecto:
Nueva creación
Mi porfolio
Otros servicios de Ingeniería de datos que ofrezco
FAQ
Traducción automática
¿Qué debo proporcionar antes de realizar un pedido?
Necesitas compartir tu conjunto de datos (CSV, Excel, JSON(semi-estructurado), etc.) junto con instrucciones claras sobre qué limpieza o transformaciones necesitas.
¿Qué herramientas/tecnologías utilizas?
Principalmente uso Python y PySpark para conjuntos de datos grandes.
¿Puedes manejar conjuntos de datos grandes (millones de filas)?
Sí, para el paquete Premium diseño flujos de trabajo escalables usando PySpark que pueden manejar millones de filas de manera eficiente.
¿Recibiré el script/código junto con los datos limpios?
Sí, entregaré el conjunto de datos final y el script en Python/PySpark en el paquete premium para que puedas reutilizarlo en cualquier momento.
¿Puedes integrar con bases de datos o almacenamiento en la nube?
Sí, soy un Data Engineer y uso almacenamiento en la nube (Azure Blob, Databricks, etc.) si es necesario (para paquetes Estándar y Premium).
¿Proporcionas documentación?
Sí, para el paquete Premium proporciono documentación paso a paso para que puedas ejecutar y gestionar el flujo de trabajo fácilmente.

