Dieser Beitrag zeigt, wie RHEVM den Speicherzustand im Detail überwacht.
Zustand des Speicherpool-Managers überwachen
Der Storage Pool Manager (SPM) ist eine Verwaltungsrolle, die einem der Hosts in einem Rechenzentrum zugewiesen wird und es ihm ermöglicht, die Speicherdomänen des Rechenzentrums zu verwalten. RHEVM überprüft die SPM-Verfügbarkeit und Metadatenintegrität bei jeder SPM-Abfragerate alle 10 Sekunden.
Sie können diese Motorkonfiguration wie folgt überprüfen. Es wird nicht empfohlen, die folgenden Parameter zu ändern, es sei denn, es wird vom Support-Techniker für einen bestimmten Anwendungsfall empfohlen:
$ engine-config -g StoragePoolRefreshTimeInSeconds StoragePoolRefreshTimeInSeconds: 10 version: general $ engine-config -g SpmCommandFailOverRetries SpmCommandFailOverRetries: 3 version: general $ engine-config -g SPMFailOverAttempts SPMFailOverAttempts: 3 version: general $ engine-config -g DelayResetForSpmInSeconds DelayResetForSpmInSeconds: 20 version: general
Zustand der Speicherdomäne überwachen
Der Zustand der Speicherdomäne wird sowohl von der RHEVM-Engine als auch von KVM Vdsm überwacht.
1. RHEVM überwacht die Speicherdomäne
Das Zeitintervall in Sekunden zum Abfragen eines Host-Status durch RHEVM beträgt standardmäßig 3 Sekunden. Während des Vorgangs wird der Speicherstatus überprüft. Wenn der getRepoStats-Berichtscode ungleich Null oder lastcheck(statsGenTime – domStatus.checkTime) höher als MaxStorageVdsTimeoutCheckSec (standardmäßig 30 Sekunden) ist, wird die Speicherdomäne problematisch und ein Timer für die Domäne startet. Das Zeitlimit für Speicherdomänenfehler ist StorageDomainFailureTimeoutInMinutes (5 Minuten Standard). Wenn der problematische Status der Speicherdomäne während dieser Zeit nicht wiederhergestellt wird, wird der Host auf „nicht in Betrieb“ gesetzt. Wenn die problematische Domain während der Zeit wiederhergestellt wird, aktiviert RHEVM den KVM-Host automatisch wieder.
Hier sind zugehörige Engine-Konfigurationen:
$ engine-config -g VdsRefreshRate VdsRefreshRate: 3 version: general $ engine-config -g StorageDomainFailureTimeoutInMinutes StorageDomainFailureTimeoutInMinutes: 5 version: general $ engine-config -g MaxStorageVdsTimeoutCheckSec MaxStorageVdsTimeoutCheckSec: 30 version: general $ engine-config -g MaxStorageVdsDelayCheckSec MaxStorageVdsDelayCheckSec: 5 version: general
2. Speicherzustand der KVM-Hostüberwachung:
Wenn der KVM-Host nicht auf die Speicherdomänen zugreifen kann, wird er nicht betriebsbereit. Vdsm aktualisiert den Speicher mit dem Überwachungsintervall sd_health_check_delay. Es ruft getStorageDomainStats auf, um den Domänenstatus von dom.getStats abzurufen und seinen Status über repoStats in _getDomsStats an RHEVM zurückzugeben. Sowohl repo_stats_cache_refresh_timeout als auch sd_health_check_delay können in /etc/vdsm/vdsm.conf konfiguriert werden .