Podrobně s dostupností na VMware vSphere

Obsah

V závislosti na tom, jak výkonné máme vybavení a potřebné zdroje pro naše systémy, budeme mít průměrný poměr virtuálních počítačů na server.

Vezměte si například plánovanou údržbu serveru v Computer Center. Pokud by to před několika lety nebylo součástí klastru, systém obsažený v zařízení by byl vypnut offline, což by následně ovlivnilo i uživatele a / nebo by personál podílející se na údržbě musel pracovat ve zkrácených časových oknech (neřku -li nepříjemný).

V případě virtualizovaného prostředí lze virtuální počítače jednoduše „přesunout nebo migrovat“ na jiného člena clusteru a zařízení lze vypnout, aby na něm bylo možné pracovat. Problém je vyřešen.

Začněme vidět situace, kdy nedostatek služeb není naprogramován.

Monitorování virtuálních strojů a aplikací
Pokaždé, když vytváříme virtuální počítač, doporučujeme nainstalovat kompendium aplikací a ovladačů, které optimalizují chování virtuálního hardwaru jako celku (k dispozici pro Windows, Mac OS, Linux a další OS). Tyto nástroje, nazývané VMTools, mimo jiné zahrnují možnost hostitele sledovat virtuální počítač (prostřednictvím prezenčních signálů, jako v klastrech). Pokud do určité doby nereaguje, restartuje váš operační systém.

Podobný případ se stává s monitorováním aplikací, ale nejprve musíte získat příslušnou sadu SDK (nebo používat aplikaci, která podporuje VMware Application Monitoring).

Ale … co se stane, když je chybou hardware?

Výše uvedený klastr je první vrstvou řešení.

Sdílené úložištěKde mají všichni členové klastru přístup k virtuálním počítačům.

Síťové týmyTváří v tvář selhání jedné desky pokračují ostatní ve správě provozu.

Více cest (více cest)Pro úložiště budou nejen optimalizovat přístup, ale také dávat nadbytečnost.

Obecně řečeno, tyto tři technologie snižují dobu, kdy jsou naše informace nedostupné. Nyní, v závislosti na licencích, které máme, můžeme mít také dvě velmi zajímavé funkce: High Availability (HA) a Fault Tolerance (FT).

V obou případech vyžadujeme klastr se sdíleným úložištěm. Bez nutnosti instalace dalšího softwaru lze HA povolit a konfigurovat tak, že pokud server nebo virtuální počítač v klastru selže, automaticky se spustí na jiném členu klastru. Stojí za to objasnit, že HA není určen pro kritické virtuální počítače (virtuální stroje). Odhadovaný čas bez služby tedy bude: „Spuštění operačního systému + Spuštění služeb“.

Počet selhání hostitele podporovaných clusterem
Máme X množství virtuálních počítačů distribuovaných na serverech Y v klastru.

Kolik hostitelů může selhat, aniž by to ovlivnilo dostupnost a výkon našeho virtuálního prostředí?

HA lze nakonfigurovat tak, aby podporovalo určitý počet selhání serveru a zajistilo, že při obnově zbývá dostatek prostředků.

HA rozděluje dostupné zdroje klastru s ohledem na CPU a RAM nakonfigurované a spotřebované našimi virtuálními počítači velmi konzervativním způsobem. Trvá největší nakonfigurovaná rezervace CPU ze všech virtuálních počítačů na každém hostiteli v clusteru a pak největší rezervace paměti a její přebytek. Pokud není nakonfigurována žádná rezervace, bude to trvat minimálně 32 Mhz na VM pro CPU a 0 Mb RAM + jeho přebytek.

S těmito čísly předpokládá, že každý virtuální počítač, který používá, spotřebuje tento procesor a paměť, poté vygeneruje hodnotu zvanou velikost slotu. S touto hodnotou se určuje, kolik slotů je k dispozici / používá každý hostitel.

Problém nastává, když například máme jeden stroj s velkým CPU a rezervou paměti. Díky nakonfigurovaným rezervacím je velmi pravděpodobné, že zbytek našich virtuálních počítačů tyto prostředky ve skutečnosti nepotřebuje, což má za následek méně slotů pro náš cluster.

Procento prostředků klastru jako kapacita pro selhání
Na rozdíl od předchozí možnosti tato funguje velmi dobře, pokud máte virtuální počítače s vysoce variabilními konfiguracemi CPU a paměti.

Je možné konfigurovat procentuální hodnoty CPU a paměti samostatně, čímž je tento způsob ještě flexibilnější a následně šetří zdroje. Toto je obecně preferovaný způsob konfigurace HA.

Hostitelé pro převzetí služeb při selhání
Toto je typická konfigurace záložního clusteru. Tato možnost je dána hlavně proto, že některé organizace udržují zásady, které naznačují, že v případě jakékoli katastrofy musí být servery v pohotovostním režimu. Vzhledem k tomu, že VMware dělá dobrou správu odolnosti vůči chybám, možná by to byla ta možnost, když je dostatek zdrojů … ale rozhodně není nejlepší.

vMotion: Živé migrace
Živá migrace vám umožňuje přesouvat fungující virtuální počítače z jednoho fyzického serveru na druhý při zachování síťového připojení a identity. Aktivní paměť (spuštěné procesy) je přenášena přes vysokorychlostní síť. Celý proces trvá v gigabitové síti méně než 5 sekund.

Je možné přesunout virtuální počítač, soubory, které používá, nebo obojí, a postup lze provést se zapnutým nebo vypnutým počítačem. V druhém případě tomu říkáme „studená migrace“ a pokud stroj běží, říkáme tomu vMotion.

Použití a výhody vMotion

  • Reorganizace VM, čímž se optimalizují zdroje. Odeberte je ze serverů, které jsou náchylné k selhání nebo jsou nasycené.
  • Automatická optimalizace dostupných zdrojů (Pracuji ve spojení s Dynamic Resource Scheduler nebo DRS).
  • Dělat údržbu základní infrastruktury není třeba plánovat údržbu ani přerušovat provoz.

Každá součást stavu virtuálního počítače je během migrace zpracována odlišně. Obecná konfigurace je nejjednodušší, nepohybuje se, ale je znovu vytvořena na cílovém počítači.

Protože disk nelze v tak krátké době znovu vytvořit, je nutné mít sdílené úložiště. Aktuální stav paměti se postupně zkopíruje do cílového hostitele. Na konci kopie se porovnají stávající rozdíly, které vznikly během migrace, stav zdrojového virtuálního počítače se zmrazí a operační systém se aktivuje na cílovém virtuálním počítači. .

Protože v některých případech není možnost restartovat stroj ideální, pro kritické úkoly máme Odolnost proti chybám. To, co je v těchto případech požadováno, nepřestane fungovat kdykoli, i když jeho hostitel selže. Je to možné pouze tehdy, pokud virtuální počítač běžel na dvou místech současně. Je konfigurován na úrovni virtuálního počítače a bude generovat přesnou kopii virtuálního počítače, přičemž bude vždy 100% replikován na jiném serveru, takže v případě selhání hardwaru bude jeho dvojče jednoduše fungovat bez ztráty informací. Zajímavé, že?

Pokud by šlo jen o zdroje, povolili bychom FT na všech virtuálních strojích v našem datovém centru, ale v předchozích verzích vSphere jsme narazili na některá omezení, nejdůležitější: Nebylo možné povolit FT na počítačích, které používaly více než jeden virtuální procesor. Naštěstí v nejnovější verzi produktu podporuje až 4 virtuální procesory současně na chráněný počítač, je však třeba zvážit licencování:

Počet vCPU podporovaných virtuálním počítačem s povoleným FT je omezen úrovní licencí zakoupených pro vSphere.

Tolerance chyb je podporována následovně:

  • vSphere Standard a Enterprise. Umožňuje až 2 vCPU.
  • vSphere Enterprise Plus. Umožňuje až 4 vCPU.

To není jediný požadavek systému.

Úložný prostorVirtuální počítače musí mít sdílené úložiště. Nelze použít fyzické RDM (Raw Devide Mapping).

SíťJe nutné mít alespoň dvě virtuální karty (vmnics), jednu pro vMotion a druhou (10 gbps) pro protokolování FT. Je to nový požadavek verze 6 (dříve byly zapotřebí desky s rychlostí 1 Gb / s)

ProcesorProcesory a operační systémy musí být kompatibilní s FT (a navzájem).

Omezení

  • Není možné pořizovat snímky virtuálních počítačů, které jsou chráněny pomocí FT, a je nutné je před aktivací této funkce odstranit.
  • Virtuální disky (VMDK) větší než 2 Tb.
  • V dokumentaci k VMware je seznam konkrétních zařízení a funkcí.

A také existuje omezení počtu virtuálních počítačů na server: maximálně 4 chráněné počítače na hostitele nebo 8 chráněných vCPU (podle toho, co nastane dříve). Tato maxima zahrnují primární a sekundární počítač (a vCPU)

Rozdíly mezi starším FT (předchozí) a současným

IPv6

 Legacy FT = Není podporováno síťovými kartami nakonfigurovanými pro protokolování FT FT = Podporováno 

Rozhraní API VStorage - zálohování s ochranou dat

 Starší FT = Není podporováno FT = Podporováno

Virtuální disk

 Legacy FT = EZT (Eager Zeroed Thick) FT = Všechny typy, včetně silných a tenkých

Redundance VMDK (virtuální disk)

 Legacy FT = Single copy FT = Primární a sekundární počítače udržují nezávislé kopie, což jim umožňuje uložit je do různých úložišť dat a zvýšit redundanci

Šířka pásma síťové desky

 Starší FT = vyhrazený 1-Gb doporučený NIC FT = vyhrazený 10-Gb NIC doporučený

Kompatibilita CPU a hostitele

 Legacy FT = Vyžaduje stejný model CPU a rodinu. Téměř identické verze vSphere FT = CPU musí být kompatibilní s vSphere vMotion nebo EVC. Verze VSphere musí být kompatibilní s vSphere vMotion

Aktivujte / deaktivujte FT při spuštěném počítači

 Legacy FT = Není vždy podporováno FT = Podporováno 

Pamatujte, že FT chrání před selháním hardwaru serveru, nikoli před selháním operačních systémů nebo aplikací.

Hlídací pes serveru vCenter je to integrovaná funkce verze 6.x. Pravidelně kontroluje stav služeb tvořících vCenter, v případě potřeby restartuje administrační procesy nebo virtuální počítač.

wave wave wave wave wave