Haré ciencia de datos, aprendizaje automático y análisis predictivo con python
Desarrollador de AI Agent Claude Code LangChain n8n Experto en Data Science
Acerca de este Servicio
Tu hoja de cálculo tiene una decisión oculta. Mi trabajo es encontrarla y demostrar que es válida.
Modelo de churn con ROC AUC del 92.85% (DT International), Prophet R²=0.80 en más de 160K listados, SVM 86% en más de 4M de reseñas de Amazon.
Hago ciencia de datos y ML en churn avanzado con Python, predicciones, clasificación, segmentación, desde datos crudos y desordenados hasta un modelo en el que puedas confiar y actuar.
No entrego solo un cuaderno lleno de gráficos y doy por terminado el trabajo. Cada proyecto termina con una explicación en lenguaje sencillo sobre lo que encontró el modelo, qué tan confiable es y qué significa para tu decisión.
Lo que obtienes:
- Análisis exploratorio de datos + un informe de calidad de datos (los datos desordenados son normales, lo tengo en cuenta)
- Ingeniería de características y selección de modelos (Random Forest, XGBoost, Prophet, LSTM y más)
- Validación y ajuste, con una precisión reportada honestamente, incluyendo donde el modelo tiene dificultades
- Explicaciones SHAP para que puedas ver qué factores influyen en cada predicción
- Una entrega limpia: cuaderno, informe escrito o un servicio desplegado, tú eliges
Haz tu pedido compartiendo tu conjunto de datos y objetivo en el formulario de requisitos. ¿Quieres una revisión de viabilidad? Envíame una muestra anónima por mensaje.
Mi porfolio
FAQ
Traducción automática
¿Qué problemas de ML manejas?
Predicción de churn, pronósticos de demanda/series temporales, clasificación, segmentación, regresión — áreas donde he entregado resultados verificables (92.85% ROC AUC, R²=0.80, SVM 86.01%).
Mis datos son desordenados e incompletos, ¿es eso un problema?
Eso es lo habitual al comenzar. Cada proyecto inicia con una revisión exploratoria que identifica valores faltantes, valores atípicos e inconsistencias, y recibes un informe escrito sobre la calidad de los datos antes de modelar.
¿Cómo sé que las predicciones no son una caja negra?
Las explicaciones SHAP (Standard up) muestran exactamente qué características influyeron en cada predicción, en un lenguaje sencillo — te lo explico en la llamada de entrega.
¿Me dirás si los datos no son lo suficientemente fuertes?
Sí, de manera directa y temprana. Prefiero señalar una limitación en los datos en la primera semana que entregar un modelo que se ve bien en las pruebas y falla en producción.
¿Implementas el modelo o solo entregas un notebook?
Ambos — Básico es notebook + informe; Estándar/Premium puede incluir un servicio desplegado (FastAPI, en contenedor).
¿Puede manejar grandes conjuntos de datos?
Sí — trabajos recientes procesaron más de 4 millones de reseñas de Amazon en Apache Spark con MLlib. La escala rara vez es el límite; la calidad de los datos suele serlo.
¿Qué pasa si la precisión decepciona después de la entrega?
Para eso están las revisiones — vuelvo a ajustar, re-validar y uso el desglose SHAP para mostrar qué está impulsando cualquier brecha. El alcance de la revisión cubre metodología + ingeniería de características en los datos que proporcionas; no puede superar los límites fundamentales de calidad de datos, que señalo *antes* de comenzar a modelar.
¿Mi equipo puede usar los resultados sin un data scientist?
Sí — El paquete Standard+ incluye una demo en Streamlit o un informe en inglés sencillo; para *consultar* resultados de forma conversacional, mira mi gig de chatbot RAG; para una API de modelo en vivo, añade la opción de endpoint FastAPI.
¿Cuál es la velocidad de respuesta y quién es dueño del trabajo?
Respondo en unas pocas horas (mañana en Reino Unido/UE + tarde en US-East, de forma asincrónica vía Fiverr). Eres dueño del notebook, los modelos y el código al entregar; no guardo copias; se ofrece NDA.

