La procedura per il ripristino di un vCenter HA in stato failed è richiesta quando i nodi Attivo, Passivo e Witness non riescono a comunicare tra loro rendendo il cluster vCenter HA non-funzionale.
Poichè il cluster HA non supporta più di un singolo punto di failure, la disponibilità del servizio viene compromessa ed è necessario ripristinare la funzionalità del vCenter per mantenere l'infrastruttura pienamente operativa.
Sequenza di shutdown del vCenter HA
Se per qualsiasi motivo fosse necessario effettuare il reboot o lo shutdown del vCenter HA, è necessario seguire una specifica sequenza per mantenere i ruoli dei nodi correnti:
- Nodo Passivo
- Nodo Witness
- Nodo Attivo
E' possibile riavviare i nodi in qualsiasi ordine.
Ripristinare un vCenter HA non funzionante
Uno dei motivi del malfunzionamento del cluster HA si verifica quando i nodi diventano isolati. I nodi non riescono più a comunicare tra di loro compromettendo la funzionalità del vCenter.
Verifica delle problematiche di connettività
Per effettuare il troubleshoot di problematiche collegate alla connettività, accedere al nodo Attivo tramite la Direct Console, effettuare il login come root ed abilitare la Bash shell.
Eseguire il comando ifconfig per verificare la funzionalità della rete:
# ifconfig -a
Nell'esempio, la Eth0 non ha un indirizzo IP assegnato.
Eseguire il seguente comando per verificare lo stato operativo dei NIC nel vCenter:
# networkctl
Come mostrato nello screenshot, la Eth0 non è operativa.
Per ottenere dettagli aggiuntivi relativi alla Eth0 eseguire il comando:
# networkctl status eth0
Poichè il NIC Eth0 non è funzionale, provare a riavviare il servizio network:
# systemctl restart systemd-networkd
Verificare nuovamente il parametro State del NIC Eth0:
# networkctl status eth0
Il parametro State del NIC Eth0 è ora indicato come routable. Riavviare il nodo per verificare se la configurazione viene mantenuta.
Quando il nodo è stato riavviato, verificare lo stato dei NIC installati:
# ifconfig -a
Eth0 non è configurata correttamente causando l'isolamento del nodo.
Se la connettività dei nodi viene correttamente ripristinata, i nodi del vCenter HA effettuano il rejoin del cluster automaticamente e il nodo Attivo si avvia soddisfando nuovamente le richieste dei client. Se la problematica di connettività non viene risolta, è necessario il ripristino della funzionalità del vCenter.
Rimozione della configurazione del cluster HA
Se la connettività non viene ripristinata, la soluzione consiste nella rimozione del cluster HA per avere il nodo Attivo nuovamente funzionante.
La prima operazione da eseguire è lo spegnimento e la cancellazione di entrambi i nodi Passivo e Witness.
Effettuare il login come root al nodo Attivo tramite la Direct Console ed eseguire il seguente comando per rimuovere la configurazione del cluster HA:
# destroy-vcha
Se viene visualizzato un messaggio di warning che interrompe il processo, eseguire nuovamente il comando aggiungendo il parametro -f:
# destroy-vcha -f
A procedura completata, riavviare il nodo:
# reboot
Dopo il riavvio del nodo Attivio, verificare lo stato della rete:
# ifconfig -a
Eth0 ha ora assegnato l'indirizzo IP corretto e il vCenter Server è nuovamente operativo.
Una volta che la funzionalità del vCenter è stata ripristinata, il cluster vCenter HA può essere nuovamente ricostruito seguendo la procedura di setup.