Se si verifica un problema nel sito di Produzione, Site Recovery è la soluzione di Nakivo inclusa in Nakivo Backup & Replication per un'efficace strategia di DR per mantenere tutti i servizi IT nel sito di DR.
Site Recovery consente di creare un efficiente Piano di Disaster Recovery per ridurre i tempi di fermo dell'azienda e la potenziale perdita di dati (immagine da Nakivo).
Blog serie
Nakivo Site Recovery - creazione Job - pt.1
Nakivo Site Recovery - VMs Re-protect - pt.2
Nakivo Site Recovery - Failback - pt.3
Vantaggi nell'utilizzo di Nakivo Site Recovery
- Facile gestione - la gestione delle attività da eseguire durante un evento di restore di emergenza è molto più semplice con Site Recovery poiché backup, replica, workflow di DR, failover e failback possono essere gestiti centralmente da un unico pannello di controllo.
- Tempo di fermo ridotto - con un workflow di DR, i servizi IT possono essere mantenuti durante un'interruzione non pianificata.
- Soluzione all-in-one - con un unico prodotto, hai a disposizione una serie di funzionalità utili per gestire la protezione dei dati, l'orchestrazione del ripristino di emergenza e il monitoraggio dell'infrastruttura IT.
- Vantaggioso - non è necessario acquistare un software o una licenza aggiuntiva, Site Recovery è incluso in Nakivo Backup & Replication Enterprise Edition senza costi aggiuntivi.
- Restore da ransomware - se si è vittime di un attacco ransomware e il sito principale è inattivo, con Site Recovery è possibile eseguire una sequenza di failover preconfigurata nel tuo sito DR per ripristinare rapidamente i servizi.
- Ambiente sandbox: per ridurre al minimo la perdita di dati e l'offline, la funzionalità dei carichi di lavoro, le patch e le nuove versioni possono essere testate in un ambiente isolato senza influire sulla produzione.
Funzionalità principali di Site Recovery
- Orchestrazione Disaster Recovery - per ridurre i tempi di fermo e l'interruzione dei servizi nel sito di produzione, Site Recovery consente di configurare un Piano di DR per creare repliche e sequenze di disaster recovery che è possibile eseguire con un semplice click.
- Replica efficiente - è possibile creare repliche per le VM mission-critical per le piattaforme supportate. Per ridurre il carico sull'ambiente di produzione, è possibile creare una replica sia dalle VM di origine sia dai backup delle VM esistenti.
- Consistenza - le app critiche, i database, SQL Server, Exchange e Active Directory sono consistenti dopo essere stati processati come replica. Non è richiesta alcuna configurazione aggiuntiva una volta accesa una replica e tutti i servizi forniti possono essere utilizzati immediatamente.
- Ruoli e autorizzazioni - è possibile assegnare ruoli e autorizzazioni specifici al personale IT per gestire tutte le attività di ripristino di emergenza (flussi di lavoro, test, accensione delle repliche, failover, failback, ecc.).
- Flussi di lavoro personalizzati - è possibile creare sequenze DR diverse per ogni scenario, ad esempio failover su un sito secondario, failback, failover pianificato e migrazione pianificata del data center.
- Notifiche - controllando regolarmente lo stato delle macchine virtuali, è possibile inviare notifiche se non è possibile raggiungere una macchina virtuale e consentire un'azione tempestiva prima che si verifichi un disastro.
- Test DR - le repliche devono essere testate per garantire che siano utilizzabili in caso di emergenza. I test possono essere eseguiti pianificati e su richiesta senza influire sull'ambiente di produzione.
Creare un workflow di disaster recovery
Per creare un Piano di DR efficace, è necessario avere una chiara panoramica della propria infrastruttura e conoscere le operazioni necessarie per ripristinare i servizi presso il sito DR.
Conoscere in anticipo la corretta sequenza di accensione delle macchine mission-critical è fondamentale per poter ripristinare velocemente i vari servizi limitando l'offline.
Per questo motivo è fondamentale disporre di un workflow di DR, ovvero una sequenza di azioni da eseguire definendo l'ordine in cui devono essere eseguite.
Operazioni di Site Recovery disponibili
Durante la creazione del Piano di DR, le azioni richieste devono essere supportate da Nakivo Site Recovery.
Le seguenti azioni sono attualmente incluse nelle piattaforme supportate:
- Failover - avvia il failover alla replica.
- Failback - ripristina le VM dalla replica della macchina virtuale alla macchina virtuale di origine. Le modifiche apportate alla replica della VM dal momento del failover vengono scritte nella VM di origine quando viene eseguita l'operazione di failback. Le VM sono sincronizzate e la macchina virtuale di origine è di nuovo nello stato di produzione effettivo.
- Start - avvia la VM.
- Stop - interrompe l'esecuzione della VM.
- Run job - esegue un tipo di job supportato (job di backup, job di replica, job di ripristino del sito, job di copia di backup o job di Flash VM Boot).
- Stop job - interrompe un lavoro.
- Run script - esegue uno script.
- Attach repository - connette un repository di backup utilizzato da Nakivo.
- Detach repository - scollega un repository di backup.
- Send e-mail - invia un'e-mail a destinatari definiti.
- Wait - attende il periodo di tempo designato prima di procedere all'azione successiva.
- Check condition - viene verificata una delle seguenti condizioni in base all'input: la risorsa esiste, la risorsa è in esecuzione, IP/nome host è raggiungibile.
Ambiente di esempio
Per testare Site Recovery, viene utilizzata un'infrastruttura di esempio. L'ambiente è composto dai seguenti componenti:
- Domain Controller
- File Server
In caso di guasto del sito di Produzione, per ripristinare i servizi nel sito di DR è necessario eseguire operazioni specifiche. Ad esempio, per accedere al File Server dobbiamo garantire che il DC sia attivo e funzionante per autenticare gli utenti che vogliono accedere al server.
Il Domain Controller sarà quindi il primo server ad effettuare il failover.
La sequenza da configurare nel Site Recovery sarà la seguente:
- Failover del Domain Controller sulla replica
- Attendere che il DC sia attivo
- Verificare se il DC è raggiungibile
- Failover dell'FS sulla replica
- Attendere che l'FS sia attivo
- Verificare se l'FS è raggiungibile
- Configurare la rete (se Prod e DR hanno VLAN diverse)
- Configurare la regola Re-IP (se Prod e DR hanno subnet diverse)
- Opzionalmente è possibile configurare il test su richiesta (utile per garantire che il job possa essere eseguito correttamente)
- Configurare le opzioni
Configurazione Site Recovery
Effettuare il login a Nakivo Backup & Replication.
Accedere all'area Jobs, cliccare sull'icona +, quindi selezionare Site recovery job sotto la voce Site Recovery Job per eseguire il wizard di configurazione.
La prima operazione da configurare è il failover del DC. Cliccare sul link Failover VMware VMs.
Selezionare il Domain Controller e cliccare Next.
Verificare che l'opzione Power off source VMs sia abilitata per evitare conflitti di IP e cliccare su Save.
Ora cliccare su Wait come operazione successiva da configurare.
Impostare Time to wait a 2/3 minuti per garantire che il DC completi l'operazione di boot. Cliccare su Save.
Cliccare su Check Condition per verificare lo stato della VM accesa.
Impostare la Condition type come Resource is running e specificare i dettagli della VM. Cliccare Save.
Ora ripetere gli stessi passaggi per la seconda VM (File Server).
- Failover VMware VMs
- Wait
- Check Condition
Quando tutte le operazioni sono state configurate, cliccare su Next.
Se i siti di Produzione e DR utilizzano VLAN diverse, selezionare l'opzione Enable network mapping per mappare la rete corretta durante il failover. La mappatura utilizzata per la replica viene presentata automaticamente e può essere quindi utilizzata. Cliccare su Create a new mapping se invece è necessario utilizzare una rete diversa. Cliccare Next.
Se i siti di Produzione e DR utilizzano subnet diverse, selezionare l'opzione Enable Re-IP. Cliccare su Select VMs per specificare le VM da configurare.
Selezionare le VM da configurare ed impostare le credenziali da utilizzare. Cliccare su Manage Credentials se si devono creare nuove credenziali. Cliccare X per uscire.
Cliccare Add existing rule se è già stata configurata una subnet.
Selezionare la subnet da utilizzare e cliccare su Close.
Cliccare Next.
Per assicurarsi che le repliche siano utilizzabili, è consigliato di testare regolarmente il Site Recover Job. Specificare la Test Schedule desiderata e fare click su Next.
Specificare il Job name e, in caso, la Job priority. Cliccare su Finish per salvare la configurazione del Job.
Il DR workflow è stato configurato ed è ora possibile eseguire il Site Recovery Job in caso di necessità.
Per garantire la minima perdita di dati e la disponibilità dei servizi, ci sono configurazioni aggiuntive da eseguire in Nakivo Backup & Replication una volta che l'operazione di failover è stata attivata:
- Re-protect VMs - le VM (repliche) in esecuzione nel sito di DR devono essere protette da una possibile failure del sito di DR mentre il sito di Produzione è inattivo.
- Failback - quando si ripristinano le VM nel sito di Produzione, qualsiasi modifica o nuovo dato nella replica della VM devono essere ritrasferiti alla VM di origine per evitare la perdita di dati.
La parte 2 illustrerà il test del Site Recovery Job e la configurazione della Re-protect delle VM per proteggere le repliche attive da possibili guasti.