Je vais configurer et mettre en place le gestionnaire de charge de travail Slurm sur votre cluster Linux
À propos de ce service
Slurm est le gestionnaire de charge de travail standard dans l'industrie pour les clusters HPC. Le configurer correctement dès le départ évite des mois d’échecs de jobs, de contention des ressources et de confusion dans la file d’attente.
J’ai configuré Slurm sur des clusters allant de 4 nœuds dans des laboratoires de recherche à 600 nœuds pour des systèmes de supercalcul national dans le cadre du programme NSM en Inde.
Ce que je fournis :
fichier slurm.conf configuré pour votre matériel et votre charge de travail, partitions, QOS et paramètres de priorité
application de cgroup pour l’isolation mémoire et CPU
mise en place de la base de données de comptabilité (slurmdbd)
soumission de jobs de test et vérification
documentation de chaque décision de configuration
Compatible avec : Rocky Linux, AlmaLinux, CentOS, Ubuntu
Compatible avec : OpenHPC, Warewulf, xCAT, bare metal
Avant de commander : partagez le nombre de nœuds, le système d’exploitation et les charges de travail que vous prévoyez d’exécuter. Je confirmerai le bon package dans les 2 heures.
Serveur:
Autres
Système opérateur:
Linux

