Soy científico de datos e ingeniero en machine learning especializado en transformar datos desordenados en conjuntos de datos limpios y útiles. Ayudo a las empresas a ahorrar horas de trabajo manual m...
Limpieza y higiene de datos: Detectar y eliminar filas duplicadas, manejar valores nulos o faltantes usando métodos de imputación inteligentes y eliminar características irrelevantes.
Corrección estructural y formateo: Estandarizar fechas, corregir tipos de datos incorrectos (por ejemplo, convertir números en texto a flotantes) y limpiar cadenas de texto usando patrones regex personalizados.
Integración de datos: Fusionar, unir y consolidar múltiples hojas o archivos de datos dispares en un solo conjunto de datos principal y coherente.
Preprocesamiento avanzado para ML: Ejecutar codificación categórica (One-Hot, Label o Target encoding) y aplicar escalado/normalización adecuado de características (MinMax o Standard Scaling) optimizado para arquitecturas predictivas complejas.
Ingeniería de características: Crear nuevas variables de interacción y aplicar transformaciones matemáticas personalizadas para maximizar la señal en tus datos.