Como investigador de IA especializado en visión por computadora y optimización de aprendizaje profundo, construyo y comprimo redes neuronales complejas para lograr velocidades máximas de inferencia en configuraciones de hardware con recursos limitados sin comprometer las métricas de precisión.
¿Por qué elegir este servicio?
- Optimización de arquitectura de modelos de élite: Diseño pipelines personalizados de CNN y ajuste fino de Vision Transformers (ViTs) para elevar la precisión de clasificación desde límites básicos hasta requisitos clínicos/operativos máximos.
- Compresión avanzada de modelos: Ejecutar modelos de visión masivos en configuraciones edge es ineficiente. Aplico flujos de trabajo de Knowledge Distillation personalizados de estudiante a profesor para reducir la huella de memoria sin afectar los criterios de rendimiento del modelo.
- Despliegues listos para producción: Sin configuraciones complicadas. Convierto pesos complejos en entornos ONNX Runtime optimizados, junto con APIs de predicción rápidas para un despliegue de software en tiempo real sin problemas.
La pila técnica:
- Frameworks: PyTorch, TensorFlow, ONNX Runtime.
- Arquitecturas: CNNs personalizadas, ResNet, MobileNet, Vision Transformers (ViTs).
- Herramientas de despliegue: Docker, capas REST Flask/FastAPI, Linux.