Crearé un script de ETL en python para limpiar, fusionar y consolidar tus datos CSV

Parte de la información se ha traducido automáticamente.

India

Hablo Inglés, Japonés, Francés

1 pedido completado

Datos y Software

Soy ingeniero de datos en Python especializado en pipelines ETL, limpieza de datos y consolidación de CSV/Excel. Transformo exportaciones desordenadas e inconsistentes de múltiples fuentes en un conju...
Acerca de este Servicio

¿Tienes hojas de cálculo de diferentes equipos, herramientas o departamentos, cada una con diferentes nombres de columnas, formatos de fecha, registros duplicados y valores sucios? Limpiarlas y fusionarlas manualmente es lento y propenso a errores. Automatizaré todo en Python + Pandas.

Lo que hago

Construyo un flujo de trabajo ETL reutilizable que:

  • Extrae datos de todos tus archivos CSV/Excel en una sola ejecución
  • Mapea diferentes nombres de columnas de origen a un esquema estándar
  • Limpia y estandariza elimina espacios en blanco, corrige mayúsculas y minúsculas, convierte todas las fechas a AAAA-MM-DD, elimina símbolos de dinero/unidades y convierte cantidades y montos en números limpios
  • Estandariza categorías (por ejemplo, valores de estado en un conjunto coherente)
  • Valida registros y elimina filas con campos requeridos vacíos
  • Elimina duplicados para que cada registro aparezca una sola vez
  • Consolida todo en un archivo maestro en UTF-8, listo para reportes

Lo que obtienes

  • Un script de Python limpio, bien documentado que tú posees completamente
  • Tu archivo de salida consolidado (CSV/Excel)
  • Un README con instrucciones de instalación y ejecución
  • Código reutilizable para los archivos del próximo mes sin necesidad de reprogramar

Por qué elegirme

  • Especialista en ingeniería de datos y ETL, no un generalista
  • Código limpio, legible y comentado (sin cajas negras)
  • Resultados consistentes y repetibles en cada ejecución
  • Respuestas rápidas, en tiempo real

Tecnología:

Amazon Redshift

apache spark

Excel

MATLAB

Python

Experiencia:

Clasificación

Extracción de Datos

Flujo de Datos

Mi porfolio