Quando un host ESXi membro del cluster vSAN si danneggia per qualsiasi motivo, è opportuno sostituirlo il prima possibile per evitare perdita di dati.
Può capitare che un host si danneggi o che l'installazione dell'ESXi si corrompa con il risultato di interrompere i servizi forniti. Se il cluster vSAN ha un buon design, i dati salvati nello storage vSAN sono ancora accessibili anche se un host si danneggia, ma l'integrità dei dati e la disponibilità non può essere garantita se anche un secondo host accusa dei problemi.
L'hardware danneggiato deve essere sostituito e l'ESXi reinstallato celermente lasciando possibilmente i dischi utilizzati nello storage vSAN inalterati (naturalmente se il disco non è il componente danneggiato) per preservare la struttura logica.
Sostituire un host danneggiato
Una volta che l'hardware danneggiato è stato sostituito o l'ESXi è stato reinstallato, accendere l'host. Selezionare il cluster vSAN e posizionarsi nella sezione Monitor > vSAN per verificare l'health status del vSAN. Lo State dell'host sostituito dovrebbe essere indicato come Abnormal se una nuova installazione è stata fatta per ripristinare la funzionalità dell'host. Piuttosto evidente che qualche problema si sta verificando nel cluster vSAN.
Verificare lo stato del cluster vSAN
Per capire cosa sta accadendo all'host sostituito, è necessario operare a livello di host verificando lo stato del cluster utilizzando i comandi esxcli. Abilitare il servizio SSH nell'ESXi sostituito e logarsi con le credenziali di root.
Dalla console eseguire il seguente comando per ottenere informazioni del cluster vSAN:
# esxcli vsan cluster get
Come previsto, il nuovo host non è membro di nessun cluster vSAN perchè la procedura di reinstallazione ha eliminato la configurazione. Se un backup aggiornato della configurazione dell'host è disponibile, è possibile risparmiare tempo nel processo di ripristino della configurazione.
Join dell'host sostituito al cluster vSAN
Per effettuare il join dell'host al cluster vSAN, è necessario conoscere il corretto UUID in uso. Effettuare una connessione SSH in un ESXi operativo membro del cluster vSAN per recuperare l'UUID ed eseguire il seguente comando esxcli:
# esxcli vsan cluster get
Quando il numero dell'UUID è stato identificato, annotare il numero (o semplicemente copiarlo) e riaccedere alla console dell'host sostituito. Per effettuare il join del nuovo host al cluster vSAN, eseguire il comando dalla console dell'host sostituito:
# esxcli vsan cluster join -u <UUID>
dove l'UUID è il numero precedentemente annotato.
Quando il processo è stato completato, eseguire il seguente comando nuovamente per ottenere le info del cluster vSAN:
# esxcli vsan cluster get
Il nuovo host ESXi è ora un membro del cluster vSAN.
Dal vSphere Web Client, selezionare il cluster vSAN e posizionarsi nella sezione Monitor > vSAN. Cliccare sul bottone Retest per verificare l'health status.
Sono ancora indicati alcuni errori relativi alla disponibilità dei dati. Per risolvere il problema, cliccare sul bottone Repair Objects Immediately.
Lo stato di Health ora risulta ottimale e il datastore vSAN sta funzionando correttamente.
Nell'area Datastores, lo Status del vSAN è indicato come Normal.
Assicurarsi di avere un design robusto del proprio cluster vSAN e una buona strategia di backup operativa per evitare potenziali perdite di dati nel caso il vSAN non possa essere ripristinato.
grazie Paolo, scusami una domanda, non hai dovuto quindi fare anche il re-claim dei dischi dell'host dopo averlo inserito nel cluster?
quindi una volta che l'hai re-inserito correttamente nel cluster vsan con l'UUID corretto, il claim dei dischi è stato "automatico"?
In questo caso la struttura logica dei dischi non è stata toccata ma è stato reinstallato solo l'ESXi, quindi una volta fatto il join al cluster vSAN, i dischi sono stati riconosciuti automaticamente.
grazie!