Seré tu experto en visión por computadora y aprendizaje profundo

Parte de la información se ha traducido automáticamente.
5.0
5.0

Pakistán

Hablo Urdu, Punjabí, Inglés, Español

7 pedidos completados

Ingeniero de IA Full Stack: visión por computadora, OCR, sistemas RAG Multi Agent LLM

Trabajo en la convergencia de computación de alto rendimiento, diseño de algoritmos complejos y inteligencia artificial de nivel producción. Mientras que los desarrolladores genéricos dependen de abst...

Nivel 1

Ha cumplido determinados criterios de rendimiento y muestra un gran potencial en la plataforma.

Acerca de este Servicio

1. Visión por computadora e inteligencia visual

  • Detección y seguimiento de objetos: YOLOv8/v12/World, modificaciones personalizadas en la columna vertebral (TSM-YOLO) y seguimiento avanzado de múltiples objetos (SORT/DeepSort/ByteTrack).
  • Segmentación de precisión: Integración de extremo a extremo de SAM 2 (Segment Anything Model 2) para segmentación a nivel de instancia y detección de anomalías.
  • Análisis temporal: Reconocimiento de acciones y detección de estados usando TSM (Temporal Shift Modules) y arquitecturas LSTM/Transformer para transmisiones de video.
  • OCR inteligente y AI para documentos: Pipelines escalables para automatización de documentos, reconocimiento de placas y extracción de datos.

2. Arquitectura de IA de pila completa

  • Puente entre modelo y API: Diseño de endpoints de inferencia de alta concurrencia usando FastAPI, Node.js o Go.
  • Frameworks agenticos: Construcción de sistemas multi-agente donde los modelos de visión se comunican con LLMs (Phi-4, Llama) para razonar sobre datos visuales.
  • Integración de bases de datos: Estructuración de bases de datos SQL (Postgres/SQLite) y de vectores (Pinecone/Milvus) para almacenar y consultar embeddings de manera eficiente.
  • Despliegue y operaciones: Contenerización (Docker/Kubernetes), optimización en el borde (TFLite, CoreML, TensorRT) y despliegue en la nube (AWS/GCP/Azure).


  1. Diseño arquitectónico
  2. Desarrollo de pila completa
  3. Rigurosidad

API:

Microsoft Computer Vision AI

Amazon Rekognition

Experiencia:

Procesamiento de imágenes

Lenguaje de programación:

Python

R

MATLAB

Colab

MLflow

Herramientas:

Jupyter Notebook

opencv

TensorFlow

MLflow

CVAT

Colab

Marcos:

Scikit-learn

DeepPy

Google ML Kit

SimpleCV

PyTorch

Mi porfolio

Otros servicios de Ciencia de datos y aprendizaje automático que ofrezco

Reseñas

2 comentarios sobre este Servicio
5.0

(2)
(0)
(0)
(0)
(0)
Desglose de calificaciones
  • Nivel de comunicación del Freelancer
    5
  • Calidad de la entrega
    5
  • Valor de la entrega
    5
Ordenar por
Más relevante
  • S

    sabaalbo

    US

    Estados Unidos

    5

    He is really committed on a good work

    USD100-USD200

    $

    2 semanas

    Tiempo

    Útil?
    No
  • E
    image-docs

    expert_ikram7

    PK

    Pakistán

    5

    Outstanding ecperiance! The seller deliverd excatly what I needed, on time and with great attention to detail. Communication was clear and professional throughout.Highly recomendedand I will definitely be back for furture projects.

    Hasta USD50

    $

    1 día

    Tiempo

    Útil?
    No
Reseñas

2 comentarios sobre este Servicio
5.0

(2)
(0)
(0)
(0)
(0)
Desglose de calificaciones
  • Nivel de comunicación del Freelancer
    5
  • Calidad de la entrega
    5
  • Valor de la entrega
    5
Ordenar por
Más relevante
  • S

    sabaalbo

    US

    Estados Unidos

    5

    He is really committed on a good work

    USD100-USD200

    $

    2 semanas

    Tiempo

    Útil?
    No
  • E
    image-docs

    expert_ikram7

    PK

    Pakistán

    5

    Outstanding ecperiance! The seller deliverd excatly what I needed, on time and with great attention to detail. Communication was clear and professional throughout.Highly recomendedand I will definitely be back for furture projects.

    Hasta USD50

    $

    1 día

    Tiempo

    Útil?
    No