Construiré soluciones de OCR y visión por computadora con python y opencv

H
harshaldonarkar
H
harshaldonarkar
Harshal D
Parte de la información se ha traducido automáticamente.

Acerca de este Servicio

Traducción automática

¿Necesitas OCR, clasificación de imágenes, detección de objetos o una pipeline personalizada de visión por computadora? Construyo sistemas de CV de nivel producción que realmente funcionan fuera de un Jupyter notebook.


LO QUE ENTREGARÉ:

OCR de documentos (facturas, recibos, formularios, texto manuscrito)

Clasificación de imágenes con CNNs personalizadas

Detección y seguimiento de objetos (YOLO, detectron)

Pipeline multimodal (OCR + NLP + post-procesamiento con LLM)

OCR en idiomas indios (hindi, maratí, scripts indicios)

Despliegue en producción con Docker y APIs REST


LO QUE obtendrás:

- Código Python limpio y documentado que será tuyo

- Preprocesamiento ajustado a la calidad de tus imágenes

- Validación de precisión con tus datos reales

- Contenedor Docker listo para desplegar (Premium)

- Endpoints de API REST (Estándar y Premium)


TECNOLOGÍAS:

OpenCV, Tesseract, EasyOCR, PaddleOCR

TensorFlow, PyTorch, Keras

YOLO, Detectron2, CNNs personalizadas

FastAPI, Flask, Docker


MI HISTORIAL EN CV:

- Implementé la pipeline de video Whisper + OCR en Sambhav AI (50% más rápido, desplegado en Kubernetes)

- Publicé investigación en CNN en IJCNIS (clasificador de cáncer de piel, más del 80% TPR)

- Modelo de predicción de cáncer de mama (97% de precisión en más de 10K registros)

- Creé un parser de facturas POS con OCR (ISKCON, ShopMind)

- GitHub: github.com/harshaldonarkar


Envíame un mensaje

Conoce a Harshal D

Harshal D

AI Engineer: RAG Pipelines and LLM Integration Expert

  • DeIndia
  • Miembro desdeabr 2022
  • Idiomas

    Hindi, Maratí, Inglés
AI Engineer with 2 published research papers (IJCNIS, IRJET) and production deployments. Previously at Sambhav AI where I built Whisper+OCR pipelines and multimodal AI — delivered 50% performance gains. I specialize in RAG systems with LangChain, LLM integration (GPT-4, Claude, Gemini), computer vision with OpenCV, OCR pipelines, and production ML deployment with Docker. I ship working code, not prototypes. Portfolio: harshaldonarkar.github.io | GitHub: harshaldonarkar

Traducción automática

Mi porfolio

Otros servicios de Desarrollo de IA que ofrezco