Crearé modelos de aprendizaje por refuerzo y razonamiento para investigación y agentes

Parte de la información se ha traducido automáticamente.
5.0
5.0

India

Hablo Inglés, Hindi, Maratí

8 pedidos completados

Soy ingeniero en Visión por Computador y científico de datos. Interesado en trabajar en proyectos relacionados con el aprendizaje automático. También interesado en trabajar en aprendizaje por refuerzo...
Acerca de este Servicio

¿Buscas un Ingeniero de investigación en IA especializado en Deep Learning, Reinforcement Learning (RL) y razonamiento con Large Language Models (LLMs)?

Ayudo a investigadores, startups y empresas a diseñar, ajustar y optimizar sistemas avanzados de IA que van más allá de la simple generación de texto, permitiendo razonamiento, toma de decisiones y comportamiento de agentes inteligentes.


Lo que ofrezco:

  • Desarrollo de LLMs de razonamiento
  • Prompting de cadena de pensamiento
  • LLMs con herramientas y razonamiento en múltiples pasos
  • Benchmarking en tareas de razonamiento
  • Reinforcement Learning para LLMs
  • RLHF (Reinforcement Learning con retroalimentación humana)
  • RLAIF (RL con retroalimentación de IA)
  • Optimización de políticas para alineación y seguridad
  • Soluciones personalizadas de Deep Learning
  • Arquitecturas transformer, embeddings, IA generativa
  • Ajuste fino para tareas específicas de dominio (chatbots, búsqueda, resumen, agentes)
  • Optimización y despliegue
  • Compresión de modelos (cuantización, poda, destilación)
  • APIs de inferencia escalables y pipelines de MLOps

️ Herramientas y frameworks:

  • Deep Learning: PyTorch, TensorFlow, JAX
  • RL y entrenamiento de LLMs: Hugging Face TRL, librerías RLHF, PPO, CRPO DeepSpeed, Accelerate
  • Razonamiento con LLMs: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

Experiencia:

Desarrollo de software

Lenguaje de programación:

Python

Reseñas

1 comentarios sobre este Servicio
5.0

(1)
(0)
(0)
(0)
(0)
Desglose de calificaciones
  • Nivel de comunicación del Freelancer
    5
  • Recomendar a un amigo
    5
  • Servicio según lo descrito
    5
Ordenar por
Más relevante
  • B

    billyjoel99

    US

    Estados Unidos

    5

    Ok thank you

    Útil?
    No
Reseñas

1 comentarios sobre este Servicio
5.0

(1)
(0)
(0)
(0)
(0)
Desglose de calificaciones
  • Nivel de comunicación del Freelancer
    5
  • Recomendar a un amigo
    5
  • Servicio según lo descrito
    5
Ordenar por
Más relevante
  • B

    billyjoel99

    US

    Estados Unidos

    5

    Ok thank you

    Útil?
    No