vSphere 5.5 Update1: NFS si disconnette da ESXi

nfsdisconnect01

Dopo aver aggiornato vSphere 5.5 a Update 1, i datastore NFS si disconnettono a caso dall’ESXi. Il problema è stato riportato da VMware nell’articolo pubblico KB 2076392.

Il problema causa un’intermittenza APD per i datastore NFS con il risultato che le VM non possono effettuare nessuna operazione di  I/O verso il datastore mentre è disconnesso.

I sintomi principali che si manifestano nel sistema sono i seguenti:

  • le VM risultano frozen
  • i datatstore NFS sono indicati grayed out

Il log vobd riporta entries simili a:

2014-04-01T14:35:08.074Z: [APDCorrelator] 9413898746us: [vob.storage.apd.start] Device or filesystem with identifier [12345678-abcdefg0] has entered the All Paths Down state.
2014-04-01T14:35:08.075Z: [APDCorrelator] 9414268686us: [esx.problem.storage.apd.start] Device or filesystem with identifier [12345678-abcdefg0] has entered the All Paths Down state.
2014-04-01T14:36:55.274Z: No correlator for vob.vmfs.nfs.server.disconnect
2014-04-01T14:36:55.274Z: [vmfsCorrelator] 9521467867us: [esx.problem.vmfs.nfs.server.disconnect] 192.168.1.1/NFS-DS1 12345678-abcdefg0-0000-000000000000 NFS-DS1
2014-04-01T14:37:28.081Z: [APDCorrelator] 9553899639us: [vob.storage.apd.timeout] Device or filesystem with identifier [12345678-abcdefg0] has entered the All Paths Down Timeout state after being in the All Paths Down state for 140 seconds. I/Os will now be fast failed.
2014-04-01T14:37:28.081Z: [APDCorrelator] 9554275221us: [esx.problem.storage.apd.timeout] Device or filesystem with identifier [12345678-abcdefg0] has entered the All Paths Down Timeout state after being in the All Paths Down state for 140 seconds. I/Os will now be fast failed.

L’unica soluzione al momento per questo problema è l’evitare di effettuare l’aggiornamento a vSphere 5.5 Update 1 o ritornare alla versione originale di vSphere 5.5 poichè non sono ancora disponibili fix da parte di VMware.

firma