Je vais programmer nvidia isaac sim et apprentissage par renforcement dans isaac lab


À propos de ce service
Traduction automatique
Déployer des simulations accélérées par GPU et des pipelines d'apprentissage par renforcement dans NVIDIA Isaac Sim
Vous avez besoin d’un apprentissage par renforcement (RL) de pointe ou d’une simulation précise en physique pour des quadrupèdes, bipèdes ou manipulateurs complexes ? Je configure les environnements NVIDIA Isaac Sim et Isaac Lab (anciennement Orbit) pour créer des pipelines d’entraînement de haute fidélité.
Ce que je propose :
1 importation d’actifs (URDF vers USD) :** Importer vos modèles CAD/URDFs en OpenUSD, ajuster les matériaux physiques, les propriétés de masse et les maillages de collision.
2 tâches Isaac Lab Gym :** Créer des environnements d’apprentissage par renforcement personnalisés, configurer les espaces d’action/observation et concevoir les fonctions de récompense.
3 entraînement de politique RL :** Entraîner des politiques stables avec Stable-Baselines3, rsl_rl ou des algorithmes PPO personnalisés avec des environnements parallèles accélérés par CUDA.
4 pont ROS2 et transfert sim-to-real :** Mettre en place des ponts de communication pour déployer des politiques de réseaux neuronaux entraînées sur du matériel physique réel.
Livrables :
1 environnement Python documenté.
2 fichiers USD et scripts de tâches personnalisées.
3 poids de modèles pré-entraînés.
4 environnement Docker.
Veuillez me contacter avant de commander pour discuter des DoF de votre robot et des objectifs de la tâche RL !*
Découvrez Aman Patel
System Integrator
- DeInde
- Membre depuisavr. 2023
- Temps de réponse moy.1 heure
Langues
Hindi, Gujarati, Anglais, Marathi
Traduction automatique
Mon portfolio
FAQ
Traduction automatique
Q : Pourquoi recommandez-vous NVIDIA Isaac Sim plutôt que Gazebo pour l’entraînement AI ?
R : Isaac Sim est basé sur NVIDIA Omniverse et utilise le moteur physique PhysX, qui fonctionne directement sur le GPU. Cela permet de simuler des milliers de robots en parallèle, accélérant les temps d’entraînement de l’apprentissage par renforcement de semaines à heures.
Q : Comment transférons-nous la politique entraînée à un robot réel ?
R : Je configure le script d’inférence de politique en Python/C++ pour lire en temps réel les états des joints de votre matériel (via ROS2 ou communication série), les faire passer par le modèle entraîné, et renvoyer les couples ou vitesses cibles aux moteurs.
Q : Concevez-vous les fonctions de récompense pour l’apprentissage par renforcement ?
R : Oui. Je personnalise les fonctions de récompense selon votre tâche. Par exemple, pour la marche quadrupède, j’inclus des récompenses pour le suivi de la vitesse cible, la stabilité en hauteur du corps, et le contact des pieds, ainsi que des pénalités pour les couples élevés, les pics de vitesse des joints et les collisions.
Q : Pouvez-vous exécuter l’entraînement sur un serveur sans affichage ?
R : Oui. Je package tout l’environnement Isaac Sim dans un conteneur Docker configuré pour fonctionner sans affichage sur vos instances cloud avec GPU (AWS, GCP) ou sur un serveur local, vous permettant d’entraîner des modèles via SSH.

