Crearé soluciones personalizadas de visión por computadora
Soy RIdwan Kamar, Principal Data Scientist e Ingeniero de Visión por Computadora con más de 10 años de experiencia entregando aplicaciones impulsadas por IA.
Detección y seguimiento de objetos
- Modelos entrenados a medida (YOLO, Faster-RCNN, EfficientDet, Detectron2)
- Seguimiento de múltiples objetos en tiempo real (ByteTrack, DeepSORT, OC-SORT, StrongSORT)
- Conteo de objetos con análisis de dirección y flujo
Procesamiento y segmentación de imágenes
- Segmentación de instancia y semántica (Mask-RCNN, U-NET, SAM2)
- Detección de defectos industriales e inspección de calidad
- Estimación de pose y reconocimiento facial (FaceNet, ArcFace, RetinaFace)
- Estimación de profundidad y análisis dimensional
OCR y comprensión visual de documentos
- OCR para imágenes, PDFs y documentos escaneados (Tesseract, PaddleOCR, Azure Document Intelligence, AWS Textract)
- Detección de texto en tiempo real en transmisiones en vivo/videos
- Análisis inteligente de documentos y conversión a Excel, Sheets o APIs
Aplicaciones de extremo a extremo
- Aplicaciones de escritorio, web y móvil impulsadas por IA
- Integración de REST API para pipelines de CV
- Despliegue en la nube en AWS, Azure, GCP
Pila tecnológica
- ML/DL: PyTorch, TensorFlow, Keras, Scikit-learn, mlflow, roboflow
- Lenguajes: Python, C++ Julia