Nicht mehr reagierende VM unter ESXi rabiat abschalten

Es kann vorkommen, dass eine VM nicht mehr reagiert - in aller Regel hilft hier das Neustarten der betroffenen VM.

In seltenen Fällen kann es passieren, dass dieser Neustart-Prozess nicht fehlerfrei durchläuft. Erkennbar ist das meist daran, dass dieser Vorgang, der in der Regel nur weniger Sekunden dauert, mehrere Minuten andauert und der Fortschrittsbalken in der Aufgabenliste stehen bleibt.

Dieses Problem hatte ich kürzlich - stutzig machte mich hier folgende Fehlermeldung, wenn die Konsole der VM aufgerufen wurde:

1Unable to connect to the MKS: There is no VMware process running for config file ...

Laut einem VMware Knowledge Base-Artikel hilft das Abschalten des Hardware-Monitoringdienstes - das half in meinem Fall jedoch nicht.

Ich muss den Prozess der VM rabiat beenden, um die VM wieder neustarten zu können.

Hierzu muss zunächst der SSH-/Konsolenzugang des ESXi-Hosts aktiviert werden. Wenn der vSphere Client verwendet wird, befindet sich diese Einstellung unterhalb "Konfiguration" in den Sicherheitsprofil-Einstellungen.

Wenn SSH aktiviert ist, wird in der Übersicht des ESXi-Hosts folgender Hinweis angezeigt:

1Konfigurationsprobleme
2Der Remote-Support-Modus (SSH) wurde für den Host xxx aktiviert

Es empfiehlt sich, SSH wieder zu deaktivieren, sobald die nicht reagierende VM gestoppt wurde.

Nachdem eine SSH-Verbindung zum ESXi-Host hergestellt wurde, kann ganz einfach mit ps und grep nach dem Parent Process ID (PPID) der VM (zweite Spalte der vmx-Prozesse) gesucht werden:

1~ # ps|grep -i DEADVM
227321599      vmm0:DEADVM
325806081      vmm1:DEADVM
421190063 27333880 mks:DEADVM           /bin/vmx
521181872 27333880 vcpu-0:DEADVM        /bin/vmx
621161393 27333880 vcpu-1:DEADVM        /bin/vmx

In diesem Fall ist die entsprechende PPID 27333880 - der folgende Befehl beendet diesen Prozess. Funktioniert dieser Aufruf nicht (nach einigen Sekunden das vorherige Kommando erneut ausführen!), hilft vermutlich das Verwenden des Kill-Signals 9:

1# kill 27333880
2# kill -9 27333880

Die VM ist damit beendet - es ist möglich, dass der ESXi-Host die VM für die nächsten 30 Sekunden als "verwaist" markiert. Hiervon nicht beeindrucken lassen - nach einigen Sekunden sollte sich die VM wieder starten lassen.

Übersetzungen: