Ich arbeite an einem Cluster-Computer, der den Slurm-Job-Manager verwendet. Ich habe gerade einen Multithread-Code gestartet und möchte die Kern- und Thread-Nutzung für eine bestimmte Knoten-ID überprüfen. Zum Beispiel
scoreusage -N 92512
were „scoreusage“ ist der Befehl, bei dem ich mir nicht sicher bin.
Akzeptierte Antwort:
Es ist ein paar Jahre her, seit ich einen Slurm-Cluster betrieben habe, aber squeue
sollte dir geben was du willst. Versuchen Sie:
squeue --nodelist 92512 -o "%A %j %C %J"
(das sollte Ihre Job-ID, Ihren Jobnamen, CPUs und Threads für Ihre Jobs auf dem Knoten 92512 enthalten)
Übrigens, es sei denn, Sie möchten ausdrücklich nur Details von einem bestimmten Knoten, suchen Sie möglicherweise besser nach Job-ID als nach Knoten-ID.
Es gibt viele gute Websites mit Dokumentationen zur Verwendung von Slurm, die im Internet verfügbar sind und leicht über Google gefunden werden können – die meisten Universitäten usw., die einen HPC-Cluster betreiben, schreiben ihre eigenen Dokumente und Hilfen und „Spickzettel“, die auf die Details ihres spezifischen Clusters zugeschnitten sind (s) (berücksichtigen Sie dies und passen Sie alle Beispiele an IHREN Cluster an). Es gibt auch eine gute allgemeine Dokumentation zur Verwendung von slurm
unter https://slurm.schedmd.com/documentation.html