Ofrezco soluciones completas de visión por computadora, aprendizaje automático y IA. Desde recolección y anotación de datos hasta entrenamiento, optimización y despliegue de modelos.
Servicios que ofrezco
- Detección y reconocimiento de objetos usando YOLOv11, Detectron2, DINOv3
- Seguimiento de múltiples objetos con ByteTrack y DeepSORT
- Segmentación de imágenes incluyendo Mask R-CNN, U-Net y YOLO-Seg
- Estimación de pose humana usando ViTPose y YOLO-Pose
- Estimación de profundidad y extracción de características (puntos clave y embeddings)
- Sistemas de reconocimiento facial con FaceNet, DeepFace y Dlib
- Soluciones OCR para imágenes, PDFs y documentos escaneados (PaddleOCR, Azure Document Intelligence, AWS Textract)
- GANs y modelos de generación de imágenes
- Generación de subtítulos para imágenes y modelos de visión-lenguaje
- Procesamiento de video en tiempo real y análisis de transmisión en vivo
- Optimización de modelos con ONNX y TensorRT para inferencia rápida
- Despliegue en AWS, GCP, Android, iOS, Raspberry Pi y dispositivos Edge
Herramientas y tecnologías
- PyTorch, TensorFlow, Keras, Scikit-learn, Hugging Face
- Plataformas en la nube: AWS, GCP, Azure
- Docker para despliegues en contenedores
- Bases de datos vectoriales: Chroma, Pinecone
- Jupyter Notebook y Google Colab
- Bases de datos: MySQL, PostgreSQL
Recibirás un modelo completamente entrenado, código limpio y documentación clara.