Crearé modelos de aprendizaje por refuerzo y razonamiento para investigación y agentes

Parte de la información se ha traducido automáticamente.

Vivek Padman

5.0

India

Hablo Inglés, Hindi, Maratí

8 pedidos completados

Soy ingeniero en Visión por Computador y científico de datos. Interesado en trabajar en proyectos relacionados con el aprendizaje automático. También interesado en trabajar en aprendizaje por refuerzo...

Acerca de este Servicio

¿Buscas un Ingeniero de investigación en IA especializado en Deep Learning, Reinforcement Learning (RL) y razonamiento con Large Language Models (LLMs)?

Ayudo a investigadores, startups y empresas a diseñar, ajustar y optimizar sistemas avanzados de IA que van más allá de la simple generación de texto, permitiendo razonamiento, toma de decisiones y comportamiento de agentes inteligentes.

Lo que ofrezco:

Desarrollo de LLMs de razonamiento
Prompting de cadena de pensamiento
LLMs con herramientas y razonamiento en múltiples pasos
Benchmarking en tareas de razonamiento
Reinforcement Learning para LLMs
RLHF (Reinforcement Learning con retroalimentación humana)
RLAIF (RL con retroalimentación de IA)
Optimización de políticas para alineación y seguridad
Soluciones personalizadas de Deep Learning
Arquitecturas transformer, embeddings, IA generativa
Ajuste fino para tareas específicas de dominio (chatbots, búsqueda, resumen, agentes)
Optimización y despliegue
Compresión de modelos (cuantización, poda, destilación)
APIs de inferencia escalables y pipelines de MLOps

️ Herramientas y frameworks:

Deep Learning: PyTorch, TensorFlow, JAX
RL y entrenamiento de LLMs: Hugging Face TRL, librerías RLHF, PPO, CRPO DeepSpeed, Accelerate
Razonamiento con LLMs: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

build reinforcement learning, and reasoning llms for research and agents

Pantalla completa

Experiencia:

Desarrollo de software

Lenguaje de programación:

Python

Reseñas

1 comentarios sobre este Servicio
5.0

		(1)
		(0)
		(0)
		(0)
		(0)

Desglose de calificaciones

Nivel de comunicación del Freelancer
5
Recomendar a un amigo
5
Servicio según lo descrito
5

Más relevante

billyjoel99

Estados Unidos

Hace 3 años

Ok thank you

Útil?

Sí

Reseñas

1 comentarios sobre este Servicio
5.0

		(1)
		(0)
		(0)
		(0)
		(0)

Desglose de calificaciones

Nivel de comunicación del Freelancer
5
Recomendar a un amigo
5
Servicio según lo descrito
5

Más relevante

billyjoel99

Estados Unidos

Hace 3 años

Ok thank you

Útil?

Sí

¿Necesitas ser creativo?

¿Buscas expertos en tecnología?

¿Listo para llegar a los consumidores y convertirlos en clientes?

¿Buscas escritores?

Opera tus negocios con más inteligencia

Crearé modelos de aprendizaje por refuerzo y razonamiento para investigación y agentes

Acerca de este Servicio

1 comentarios sobre este Servicio
5.0

Desglose de calificaciones

1 comentarios sobre este Servicio
5.0

Desglose de calificaciones

Etiquetas relacionadas

¿Necesitas ser creativo?

¿Buscas expertos en tecnología?

¿Listo para llegar a los consumidores y convertirlos en clientes?

¿Buscas escritores?

Opera tus negocios con más inteligencia

Crearé modelos de aprendizaje por refuerzo y razonamiento para investigación y agentes

Acerca de este Servicio

Desglose de calificaciones

Ordenar por

Desglose de calificaciones

Ordenar por

Etiquetas relacionadas