Configuraré y ajustaré el gestor de cargas de trabajo Slurm en tu clúster Linux
Acerca de este Servicio
Slurm es el gestor de cargas de trabajo estándar en la industria para clústeres HPC. Configurarlo correctamente desde el principio evita meses de fallos en trabajos, contención de recursos y confusión en las colas.
He configurado Slurm en clústeres que van desde laboratorios de investigación de 4 nodos hasta sistemas de supercomputación nacionales de 600 nodos bajo el programa NSM de la India.
Lo que entrego:
slurm.conf configurado para tu hardware y carga de trabajo, particiones, QOS y ajustes de prioridad
Aplicación de cgroup para aislamiento de memoria y CPU
Configuración de base de datos de contabilidad (slurmdbd)
Envío de trabajos de prueba y verificación
Documentación de cada decisión de configuración
Compatible con: Rocky Linux, AlmaLinux, CentOS, Ubuntu
Compatible con: OpenHPC, Warewulf, xCAT, bare metal
Antes de ordenar: comparte el número de nodos, el sistema operativo y qué cargas de trabajo planeas ejecutar. Confirmaré el paquete adecuado en 2 horas.
Servidor:
Otros
Sistema operativo:
Linux

