Pilot Light DR met Multicloud Snaphot Technology
- Marco Tubben
- Apr 25
- 3 min read

We kennen wellicht de Nutanix Cloud Clusters (NC2) oplossing om het on-premise datacenter te extenden naar de public cloud om zo een Unified Hybrid Cloud te kunnen maken.
En dat deze dan middels de bekende Nutanix Cloud platform eenvoudig te managen is.

Het gaat te ver om alle features en voordelen hier te beschrijven, er zijn een ruime hoeveelheid blogs die hierover uitgebreid op ingaan.
Sommige klanten willen wel de voordelen van de hybride multicloud, maar zien op tegen de (hoge) kosten en dat kan kloppen, NC2 cluster(s) in de public cloud kunnen een grote aanslag zijn op het IT budget. Maar om tegen minder kosten wel een gedegen DR oplossing te hebben heeft Nutanix een aantal opties die de kosten (aanzienlijk) kunnen verlagen.
Het gebruik van een Pilot Light DR met Multicloud Snapshot Technologie (MST) kan hierbij helpen.
Het idee is om een minimaal gesized NC2 cluster in een public cloud te hebben draaien en snapshots van de (belangrijkste) VM’s niet direct op het NC2 cluster op te slaan, maar deze op regelmatige basis in een S3 bucket te zetten.
In het geval van een disaster kan het bestaande kleine cluster in de public cloud vergroot worden met extra nodes uit een AWS NC2 node pool. Dit is een pool met standby nodes die op elke gewenst moment aangesproken kunnen worden.
Op dit moment is deze optie alleen nog in Amazon’s Web Services beschikbaar, maar de Azure versie zal heel snel GTA zijn.

Ik zal hieronder in wat eenvoudige
Stap 1 Setup MST
We gaan Multicloud Snapshot Technology (MST) installeren op een pilot light cluster in NC2 op AWS. Dit inclusief de toegang regelen tot AWS S3 via een AWS Endpoint via onze eigen netwerken.
Creeren van een S3 Endpoint

Dit zorgt voor communicatie naar de AWS services / S3 bucket over het private netwerk in plaats van over het internet
Het endpoint wordt gecreeerd in hetzelfde VPC als het NC2 cluster
Creeeren van een S3 security group on de toegang tot het S3 endpoint te beveiligen

Creeeren van de daadwerkelijke S3 Bucket, belangrijk dat de bucket naam begint met nutanix-clusters als naam voor de IAM roles

Controle vrije IP adressen voor MST in subnet in Prism Central

Zoals te zien zijn er voldoende vrije IP adressen in het subnet waar Prism Central in gedeployed is
Connect naar de Cloud Prism Central middels SSH en start het volgende commando :
clustermgmt-cli deploy-cloudSnapEngine -b Nutanix-clusters-pilotlight -r <REGIO> -I <IP adressen gebruikt door MST> -s <PC-Subnetnaam>
MST software zal gedeployed worden, dit kan tot 50 minuten duren
Zodra MST gedeployed is zal de S3 bucket verschijnen als een target voor Nutanix DR
Stap 2 Recover van een snapshot opgeslagen in S3
Maak een protection policy in Prism Central

Te zien is dat de replicatie elk uur is vanaf het primaire cluster naar de S3 bucket
Voeg VM’s toe aan de policy middels een vooraf gemaakte categorie DR:S3 die aan de VM gekoppeld is

Maak een Recovery Plan in Prism Central genaamd Restore2S3

Voeg de gewenste VM’s toe

(in dit geval de VM’s met de categorie DR:S3)
Vul de juiste CIDR blocks in

Het Recovery Plan is gereed

We gaan nu overfailen naar NC2 gebruik makend van de snapshots in de S3 bucket.
Selecteer de Recovery Plan en kies voor Failover uit het action menu

In dit voorbeeld doen we een geplande failover die de laatste wijzigingen repliceerd na het down brengen van de VM

Voeg als target cluster het NC2 cluster in AWS toe en kies Failover
Er volgt een waarschuwing dat het NC2 cluster genoeg expanded is om deze workloads op te kunnen vangen, we zijn immers gestart in NC2 met een cluster van minimale grootte

Recovery plan zal uitgevoerd worden en de data zal ge-restored worden uit de S3 bucket op het NC2 cluster

Beide VM’s draaien nu op het NC2 cluster

Stap 2 Failback van NC2 naar on-prem
Na de disaster is het eenvoudig terugfailen naar het primare on-premide datacenter als de omgeving hersteld is door de VM’s weer te selecteren in het Recovery Plan en weer een failover te doen
Op de on-premise Prism Central ga weer naar Recovery Plans en selecteer de Recovery Plan en selecteer weer Failover net zoals in de stap hierboven echter nu met primary location de Cloud Prism Central, we willen immers terug naar ons eigen datacenter

Omdat de VM’s nu in NC2 draaien zijn ze geen onderdeel van de Protection Policy, maar dat maakt niet uit omdat we ze terug willen in ons eigen Datacenter

Na de waarschuwing is te zien dat de VM failover gestart wordt

VM’s zijn weer up and running in ons eigen on-premise datacenter!
Comments