Programaré NVIDIA Isaac Sim y aprendizaje por refuerzo en Isaac Lab


Acerca de este Servicio
Traducción automática
Implementa simulaciones aceleradas por GPU y pipelines de aprendizaje por refuerzo en NVIDIA Isaac Sim
¿Necesitas aprendizaje por refuerzo (RL) de última generación o simulaciones precisas en física para cuadrúpedos, bípedos o manipuladores complejos? Configuro entornos de NVIDIA Isaac Sim y Isaac Lab (antes Orbit) para construir pipelines de entrenamiento de alta fidelidad.
Lo que ofrezco:
1 importación de assets (URDF a USD):** Importar tus modelos CAD/URDFs a OpenUSD, ajustar materiales físicos, propiedades de masa y mallas de colisión.
2 tareas en Isaac Lab Gym:** Crear entornos personalizados de aprendizaje por refuerzo, configurar espacios de acción/observación y diseñar funciones de recompensa.
3 entrenamiento de políticas RL:** Entrenar políticas estables usando Stable-Baselines3, rsl_rl o algoritmos PPO personalizados con entornos paralelos acelerados por CUDA.
4 puente ROS2 y simulación a realidad:** Configurar puentes de comunicación para desplegar políticas de redes neuronales entrenadas en hardware físico real.
Entregables:
1 espacio de trabajo en Python documentado.
2 archivos USD y scripts de tareas personalizadas.
3 pesos de modelos preentrenados.
4 entorno Docker.
¡Por favor, contáctame antes de ordenar para discutir las DoF de tu robot y los objetivos de la tarea de RL!*
Conoce a Aman Patel
System Integrator
- DeIndia
- Miembro desdeabr 2023
- Responde aprox. en:1 hora
Idiomas
Hindi, Gujarati, Inglés, Maratí
Traducción automática
Mi porfolio
FAQ
Traducción automática
P: ¿Por qué recomiendas NVIDIA Isaac Sim sobre Gazebo para entrenamiento de IA?
R: Isaac Sim está construido sobre NVIDIA Omniverse y usa el motor de física PhysX, que funciona directamente en la GPU. Esto permite simular miles de robots en paralelo al mismo tiempo, acelerando los tiempos de entrenamiento de aprendizaje por refuerzo de semanas a horas.
P: ¿Cómo transferimos la política entrenada a un robot real?
R: Configuro el script de inferencia de la política en Python/C++ para leer los estados de las articulaciones en tiempo real desde tu hardware (a través de ROS2 o comunicación serial), pasarlos por el modelo entrenado y devolver los torques o velocidades objetivo a los motores.
P: ¿Diseñas las funciones de recompensa para el aprendizaje por refuerzo?
R: Sí. Personalizo las funciones de recompensa según tu tarea. Por ejemplo, para caminar en cuadrúpedo, incluyo recompensas por seguimiento de velocidad, estabilidad en la altura del cuerpo y contacto de los pies, además de penalizaciones por torques altos, picos de velocidad en las articulaciones y colisiones.
P: ¿Puedes ejecutar el entrenamiento en un servidor sin interfaz gráfica?
R: Sí. Empaqueto todo el espacio de trabajo de Isaac Sim en un contenedor Docker configurado para correr sin interfaz en tus instancias en la nube con GPU (AWS, GCP) o en un servidor local, permitiéndote entrenar modelos vía SSH.

