Zotavenie zariadení v IP sieti
Spoľahlivosť a doba zotavenia zariadení, čiže čas, za ktorý sa dostane zariadenie zo stavu nečinnosti do činnosti má priamy dopad na celkovú spoľahlivosť siete. Vývoj sieťových protokolov bol založený na vylepšeniach tvoriacich spoľahlivosť na úrovni hardvéru. Rozdelenie technológii, ktoré sa podieľajú na zvyšovaní spoľahlivosti:
- Online insertion and removal (OIR)
- Single line card reload
- High system availability (HSA)
- Route processor redundancy (RPR)
- Route processor redundancy plus (RPR+)
- Stateful switchover (SSO)
- Nonstop forwarding (NSF)
Online Insertion and Removal (OIR)
OIR technológia bola vyvinutá pre možnosť výmeny nefungujúcich častí hardvéru bez ovplyvnenia činnosti daného zariadenia. Napríklad, ak je vložená do systému nová sieťová karta, po detekovaní napätia sa sama inicializuje a začne pracovať. Táto vlastnosť je tiež nazývaná ako horúca záloha. Po analýze a inicializácií novovloženej karty, je karta pripravená na náležitú konfiguráciu.
Horúca záloha na sieťovej karte napríklad umožňuje systému určiť, kedy nastala zmena vo fyzickej konfigurácií jednotky a v prípade poruchy dokáže rozložiť prostriedky na fungujúce jednotky, aby mohli všetky rozhrania adekvátne pracovať.
Všetky potrebné úlohy spojené s výmenou sieťovej karty sú zabezpečené softvérovo. Pri zistení prerušenia činnosti hardvéru sa do softvérového subsystému odošle oznámenie o chybe, na základe ktorej sa systém primerane rekonfiguruje. Inicializačné programy použité počas OIR sú také isté ako pri štarte samotného smerovača. Systémové prostriedky sú pridelené novému rozhraniu tak, aby mohol začať okamžite fungovať. Podobne, po vybraní sieťovej karty zo systému sú priradené prostriedky prázdnemu slotu uvoľnené, alebo je minimálne indikovaná zmena stavu.
Aj keď koncepcia OIR znie jednoducho, je dôležité vedieť aká hardvérová zmena nastala. Popis činností smerovača s funkciou OIR:
- Smerovač neustále skenuje zmeny v konfigurácií na základnej doske
- Smerovač inicializuje všetky novovložené rozhrania a ich stav považuje ako nečinný.
- Smerovač privádza všetky predošlé nastavenia rozhrania na karte späť do stavu, v ktorom boli, keď bola karta odstránená. Akékoľvek novoinštalované rozhrania na karte sú považované ako nečinné.
Vplyv na smerovaciu tabuľku smerovača je taký, že cesty pripojené cez poškodené rozhranie sú vymazané, ako aj dočasná pamäť Address Resolution Protocol (ARP) . Ak je karta znovu vložená do toho istého slotu, z ktorého bola vybraná, alebo ak je na miesto poškodenej karty vložená totožná karta, sú použité informácie z predchádzajúcej inštalácie.
Ak smerovač nepodporuje OIR, odstránené, alebo pridané nové rozhranie by mohlo mať dopad na prenos informácií spracovávaných smerovačom, alebo v horšej situácií sa smerovač sám reštartuje. Preto je dôležité vedieť, či dané zariadenie podporuje OIR, alebo nie, pretože v prípade nevhodnej manipulácie môže dôjsť k nenávratnému poškodeniu sieťovej karty, v horšom prípade celého systému.
Single Line Card Reload
Jediná možnosť ako opraviť zlyhanie sieťovej karty, alebo vážne softvérové chyby pre jednu sieťovú kartu na smerovačoch, ktoré nepodporujú Single Line Card Reload bolo uskutočniť Cbus Complex, ktorý znovu zaviedol každú sieťovú kartu. Čas potrebný na dokončenie Cbus Complex bol často nevyhovujúci, pretože v tomto čase nebolo možné smerovať, alebo prepínať akýkoľvek tok dát.
Single line card reload umožňuje korigovať zlyhanie sieťovej karty na smerovači automatickým znovu načítaním kódu z poškodenej sieťovej karty a počas jej opätovného zavádzania zostávajú všetky fyzické linky a smerovacie protokoly na ostatných sieťových kartách aktívne. Takže single line card reload je významne rýchlejšie ako metóda Cbus Complex, pričom ostatné sieťové karty zostávajú funkčné.
High System Availability
Táto vlastnosť umožňuje pre zvýšenie dostupnosti inštalovať do jedného smerovača dva smerovacie procesory (RP – route processor).
Dva smerovacie procesory v smerovači poskytujú najzákladnejší stupeň zvýšenej dostupnosti systému prostredníctvom takzvanej studenej zálohy. Studená záloha znamená, že ak jeden smerovací procesor zlyhá, druhý smerovací procesor reštartuje smerovač. Takýmto spôsobom sa nemôže stať, že by bol smerovač dlhú dobu v stave nečinnosti a zároveň je výrazne zvýšená dostupnosť systému.
Ak smerovací procesor preberie operácie iného smerovacieho procesora v HSA, prevádzka systému je prerušená. Táto zmena je podobná k vydaniu príkazu na znovu načítanie. Postup pri zistení skutočnosti zlyhania jedného smerovacieho procesora a preberaní činnosti druhým:
- smerovač zastaví prepúšťanie dátového toku
- strata informácie o smerovaní
- strata všetkých spojení
Záložný (slave) smerovací procesor sa stane aktívnym (master), preberie riadenie smerovača a reštartuje ho. Záložný smerovací procesor má vlastný softvérový obraz a konfiguráciu, takže môže pôsobiť ako nezávislý procesor.
Pri procese HSA sa od začiatku zlyhania k prvému vyslaniu paketov odohrávajú nasledovné procesy:
- identifikácia zlyhania
- inicializácia pohotovostného smerovacieho procesora
- nahranie novej konfigurácie do pohotovostného smerovacieho procesora
- resetovanie a znovu načítanie sieťových kariet
- nahranie novej konfigurácie do sieťových kariet
- zistenie dostupných ciest a smerovanie dát
- konvergencia smerovacích ciest na protokolovej úrovni
HSA metóda obnovenia systému je tiež nazývaná aj ako studená záloha, čo znamená, že celý systém je nefunkčný počas obnovenia. Všetky dáta smerované cez smerovač nachádzajúci sa v procese obnovovania stavu sú stratené. Výhoda používania studenej zálohy je tá, že zariadenie sa reštartuje pomocou pohotovostného smerovacieho procesora bez akéhokoľvek manuálneho zásahu.
Možnosti aplikácie HSA:
- Simple hardware backup Použitie proti zlyhaniu obvodov procesora smerovača. Pri tejto metóde sú obidva procesory smerovača nakonfigurované rovnako. Informácia o konfigurácií je pri zmene automaticky synchronizovaná medzi obidvomi procesormi smerovača.
- Software error protection používa túto metódu k ochrane proti softvérovým chybám pri jednotlivých verziach softvéru. Pri tejto metóde, každý procesor smerovača používa vlastný softvérový obraz, ale s rovnakou konfiguráciou. Software error protection má svoje opodstatnenie pri zavádzaní nového, alebo skúšobného softvéru.
Smerovacie procesory pri rozšírenej implementácií HSA je možné nakonfigurovať nasledovne:
- rovnaké verzie softvéru, ale rozdielne konfigurácie
- rozdielne obrazy softvéru a rozdielne konfigurácie
- rozmanité konfiguračné súbory (napríklad, rôzne vlastnosti, alebo rozhrania môžu byť na karte zapnuté, alebo vypnuté
Route processor redundancy
Route procesor redundancy (RPR) poskytuje vylepšenie vlastností HSA. HSA povoľuje systému zresetovať a použiť pohotovostný route procesor v prípade zlyhania aktívneho RP.
S RPR je možné dosiahnuť rýchlejšie prepnutie medzi aktívnym a pohotovostným RP v prípade výskytu fatálnej chyby na aktívnom RP. Pri konfigurácií RPR, pohotovostný RP nahrá softvérový obaz počas vlastného štartu a inicializácie do pohotovostného módu. V prípade poruchy aktívneho RP, systém prepne na záložný RP, ktorý sa inicializuje ako aktívny RP, znovu načíta sieťové karty a reštartuje systém.
RPR eliminuje nasledovné vlastnosti v procese prepínania z primárneho procesora na záložný oproti HSA, a tým redukuje čas obnovenia systému:
krok 1: nahrá a „bootuje“ softvér do pohotovostného RP
krok 2: nahrá novú konfiguráciu do pohotovostného RP
Čas do obnovy systému je týmto redukovaný, pretože pohotovostný RP v čase preberania riadenia smerovača už má za sebou proces „bootovania“. Táto metóda sa tiež nazýva „warm standby mode“.
Route Processor Redundancy Plus
RPR+ je založené na RPR a eliminuje ďaľšie kroky:
krok 3: resetovanie a znovu načítanie sieťových kariet.
krok 4: zavedenie novej konfigurácie do sieťových kariet.
RPR+ udržiava sieťové karty v aktívnom stave počas prepínania, takže nepotrebujú reinicializáciu, a pokračujú v preposielaní dátového toku. Táto vlastnosť redukuje prepnutie z aktívneho procesora na pohotovostný procesor o 90% (cca 30 – 40 sekúnd) v porovnaní s RPR.
7.1.5Stateful Switchover
Vlastnosti stateful switchover (SSO) sú založené na RPR+ a redukujú čas od okamihu detekcie zlyhania v piatom kroku pri HSA procese prepínania aktívneho procesora na pohotovostný:
-krok 5: učenie sa dostupných ciest, a preposielanie toku dát.
SSO umožňuje aktívnemu procesoru poslať potrebné informácie o stave kľúčových ciest a protokoloch rozhrania pohotovostnému procesoru počas prepínania z aktívneho na pohotovostný, čím sa zníži čas potrebný pohotovostným procesorom na zistenie dostupných ciest.
Na akomkoľvek zariadení, na ktorom beží SSO, musia obidva procesory používať rovnaký softvér a konfiguráciu, takže pohotovostný procesor je vždy pripravený prevziať riadenie pri zlyhaní aktívneho RP. Informácia o konfigurácií medzi aktívnym RP a pohotovostným RP je synchronizovaná pri každom zapnutí smerovača a i v prípade zmeny v konfigurácií aktívneho RP. Následkom inicializačnej synchronizácie medzi dvomi procesormi, SSO získava informáciu o stave medzi RP vrátane informácie o smerovaní.
Počas prepínania je kontrola sytému premiestnená z aktívneho procesora do pohotovostného. Čas potrebný na prepnutie z aktívneho procesora na pohotovostný záleží na konkrétnej platforme. Niektoré systémy sú schopné obnovenia činnosti okamžite, bez straty jedného paketu, prípadne v čase kratšom ako desať sekúnd.
Nonstop Forwarding
NSF vlastnosti pracujú s SSO vlastnosťami v sieťovom operačnom systéme. Zatiaľ čo SSO sa zaoberá interným problémom (zlyhanie RP), NSF zamedzuje niektorým externým udalostiam, ktoré môžu zapríčiniť zlyhanie siete.
Obvykle pri reštarte sieťového zariadenia, všetky zariadenia pripojené k tomuto zariadeniu detekujú, že dané zariadenie bolo vypnuté a zapnuté. Počas doby zlyhania smerovača sú všekty susedné smerovače „zmätené“, čo vytvára nestabilné prostredie v neprospech celkového výkonu siete. NSF pomáha redukovať nestabiliu siete na zariadeniach, ktoré majú funkciu SSO.
NSF umožňuje smerovaným paketom pokračovať po známych cestách, pokiaľ nebude obnovená informácia smerovacieho protokolu po prepnutí. Susedné smerovače neočakávajú „zmätky“ pri smerovaní. Tok dát je vysielaný cez sieťové karty, pokiaľ pohotovostný RP nepreberie riadenie po zlyhanom aktívnom RP počas prepínania. Schopnosť sieťových kariet zotrvávať v činnosti počas prepínania a udržiavať spojenie so smerovacou tabuľkou na aktívnom RP je kľúčovou činnosťou NSF.
Pre fungovanie NSF boli vyvinuté rozšírenia k smerovacím protokolom ako Open Shortest Path First (OSPF), Intermediate System to Intermediate System (IS-IS), a Border Gateway Protocol (BGP). S týmito protokolmi sa NSF stala ešte rýchlejšou a prehľadnejšou, čo znamená, že smerovače podporujúce tieto protokoly sú schopné detekovať nedostupnosť a prevziať dôležité funkcie pre pokračovanie smerovania dátového toku a obnoviť informácie o smerovaní zo susedných zariadení.
Napríklad, IS-IS protokol môže byť nakonfigurovaný na použitie informácie o stave, ktorá bola synchronizovaná medzi aktívnym a pohotovostným RP pre obnovenie smerovacej informácie počas prepínania namiesto prijatia informácie od susedných smerovačov.