Construiré soluciones de visión por computadora, OCR y YOLO basadas en Python

Parte de la información se ha traducido automáticamente.

Pakistán

Hablo Urdu, Inglés

3 pedidos completados

De los datos a las decisiones, impulsado por IA y aprendizaje automático

¡Hola! Soy un científico de datos, apasionado por la IA, el aprendizaje automático, el aprendizaje profundo y la analítica de datos. Transformo datos complejos en ideas inteligentes y accionables medi...
Acerca de este Servicio

Ofrezco soluciones completas de visión por computadora, aprendizaje automático y IA. Desde recolección y anotación de datos hasta entrenamiento, optimización y despliegue de modelos.


Servicios que ofrezco

  • Detección y reconocimiento de objetos usando YOLOv11, Detectron2, DINOv3
  • Seguimiento de múltiples objetos con ByteTrack y DeepSORT
  • Segmentación de imágenes incluyendo Mask R-CNN, U-Net y YOLO-Seg
  • Estimación de pose humana usando ViTPose y YOLO-Pose
  • Estimación de profundidad y extracción de características (puntos clave y embeddings)
  • Sistemas de reconocimiento facial con FaceNet, DeepFace y Dlib
  • Soluciones OCR para imágenes, PDFs y documentos escaneados (PaddleOCR, Azure Document Intelligence, AWS Textract)
  • GANs y modelos de generación de imágenes
  • Generación de subtítulos para imágenes y modelos de visión-lenguaje
  • Procesamiento de video en tiempo real y análisis de transmisión en vivo
  • Optimización de modelos con ONNX y TensorRT para inferencia rápida
  • Despliegue en AWS, GCP, Android, iOS, Raspberry Pi y dispositivos Edge


Herramientas y tecnologías

  • PyTorch, TensorFlow, Keras, Scikit-learn, Hugging Face
  • Plataformas en la nube: AWS, GCP, Azure
  • Docker para despliegues en contenedores
  • Bases de datos vectoriales: Chroma, Pinecone
  • Jupyter Notebook y Google Colab
  • Bases de datos: MySQL, PostgreSQL


Recibirás un modelo completamente entrenado, código limpio y documentación clara.

API:

Microsoft Computer Vision AI

Amazon Rekognition

Experiencia:

Procesamiento de imágenes

Lenguaje de programación:

Python

SQL

NoSQL

MLflow

Amazon SageMaker

Herramientas:

Jupyter Notebook

opencv

TensorFlow

MLflow

Marcos:

Scikit-learn

Google ML Kit

keras

PyTorch

Panda