Gildas Le Corguillé (2f4489a1) at 25 Mar 10:41
Fix includedir
Gildas Le Corguillé (f2a395f9) at 25 Mar 10:40
Fix includedir
Gildas Le Corguillé (cb4959fb) at 22 Mar 09:47
Merge branch 'includedir' into 'master'
Gildas Le Corguillé (37e14b8d) at 22 Mar 09:46
Gildas Le Corguillé (cb4959fb) at 22 Mar 09:46
Merge branch 'includedir' into 'master'
... and 1 more commit
Gildas Le Corguillé (37e14b8d) at 22 Mar 09:46
Fix a bug when both @includedir and #includedir
le check_mode: no dit à ansible de faire ce truc tout le temps, même en check mode. Cela permet de comparer exactement les modifs qu'il compte faire. le changed_when est un peu cosmétique, en check mode il rapporte des changed à chaque fois ce qui permet éventuellement de voir le détail de ce qu'il fait. En mode réel il ne rapporte rien et ça évite de rajouter des lignes superflues et des 'changed' au log.
ok, je vais modifier ça
je n'ai pas réussi à faire une regexp satisfaisante qui peut à la fois créer des paramètres manquants et leur donner la valeur voulue. Donc je fais une passe où j'ajoute PARAM_MACHIN= s'il n'est pas présent dans la ligne. Ensuite je fais une seconde passe où je donne la bonne valeur au paramètre correspondant. Avantage : le paramètre ne change pas de place dans la ligne, donc il y a moins de chances qu'on ait un faux-"changed"
en cas d'interruption du playbook, il ne faut pas avoir des modifs en cours. Le but est d'être atomique (c'est lié au fait que je dois faire la modif en 2 fois)
ncharriere (5aa90312) at 07 Mar 16:53
Merge branch 'rsyslog-install' into 'master'
ncharriere (e904984b) at 07 Mar 14:08
ncharriere (5aa90312) at 07 Mar 14:08
Merge branch 'rsyslog-install' into 'master'
... and 1 more commit
ncharriere (e904984b) at 07 Mar 14:07
add a step to install rsyslog
Pour moi, ça me semble en ordre
AccountingStorageHost=slurm-controller
root@slurm-controller:~# grep Accounting /etc/slurm/slurm.conf
AccountingStorageEnforce=limits
AccountingStorageHost=slurm-controller
AccountingStoragePort=6819
AccountingStorageType=accounting_storage/slurmdbd
AccountingStorageUser=root
AccountingStoreFlags=job_comment
AccountingStorageTRES=gres/gpu
root@slurm-controller:~# systemctl restart slurmctld.service
root@slurm-controller:~# systemctl status slurmctld.service
root@slurm-controller:~# sacctmgr list cluster
Cluster ControlHost ControlPort RPC Share GrpJobs GrpTRES GrpSubmit MaxJobs MaxTRES MaxSubmit MaxWall QOS Def QOS
---------- --------------- ------------ ----- --------- ------- ------------- --------- ------- ------------- --------- ----------- -------------------- ---------
slurm 127.0.0.1 6817 9472 1 normal
root@slurm-controller:~# srun -M slurm hostname
cpu-node-064
root@ondemand:~# grep Accounting /etc/slurm/slurm.conf
AccountingStorageEnforce=limits
AccountingStorageHost=slurm-controller
AccountingStoragePort=6819
AccountingStorageType=accounting_storage/slurmdbd
AccountingStorageUser=root
AccountingStoreFlags=job_comment
AccountingStorageTRES=gres/gpu
root@ondemand:~# srun hostname
cpu-node-064
root@ondemand:~# srun -M slurm hostname
srun: error: Unable to allocate resources: Unable to contact slurm controller (connect failure)
root@ondemand:~# sacctmgr list cluster
Cluster ControlHost ControlPort RPC Share GrpJobs GrpTRES GrpSubmit MaxJobs MaxTRES MaxSubmit MaxWall QOS Def QOS
---------- --------------- ------------ ----- --------- ------- ------------- --------- ------- ------------- --------- ----------- -------------------- ---------
slurm 127.0.0.1 6817 9472 1 normal
AccountingStorageHost=196.168.1.35
root@slurm-controller:~# sed -i "s/AccountingStorageHost=slurm-controller/AccountingStorageHost=192.168.1.35/" /etc/slurm/slurm.conf
root@slurm-controller:~# grep Accounting /etc/slurm/slurm.conf
AccountingStorageEnforce=limits
AccountingStorageHost=196.168.1.35
AccountingStoragePort=6819
AccountingStorageType=accounting_storage/slurmdbd
AccountingStorageUser=root
AccountingStoreFlags=job_comment
AccountingStorageTRES=gres/gpu
root@slurm-controller:~# systemctl restart slurmctld.service
root@slurm-controller:~# systemctl status slurmctld.service
root@slurm-controller:~# sacctmgr list cluster
Cluster ControlHost ControlPort RPC Share GrpJobs GrpTRES GrpSubmit MaxJobs MaxTRES MaxSubmit MaxWall QOS Def QOS
---------- --------------- ------------ ----- --------- ------- ------------- --------- ------- ------------- --------- ----------- -------------------- ---------
slurm 192.168.1.35 6817 9472 1 normal
root@slurm-controller:~# srun -M slurm hostname
cpu-node-064
root@ondemand:~# srun hostname
cpu-node-064
root@ondemand:~# srun -M slurm hostname
cpu-node-064
root@ondemand:~# sacctmgr list cluster
Cluster ControlHost ControlPort RPC Share GrpJobs GrpTRES GrpSubmit MaxJobs MaxTRES MaxSubmit MaxWall QOS Def QOS
---------- --------------- ------------ ----- --------- ------- ------------- --------- ------- ------------- --------- ----------- -------------------- ---------
slurm 192.168.1.35 6817 9472 1 normal
Es-tu certain que tous les fichiers de configuration de ton cluster, y compris les clients, ont bien la variable AccountingStoreFlags=job_comment et plus AccountingStoreJobComment=yes ? Si oui, il faut vérifier aussi que le contrôleur a bien été redémarré depuis la dernière mise à jour.