Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 13098|Odpoveď: 0

[Komunikácia] Poruchy IT aplikačných systémov sú nevyhnutné a včasné odhalenie možno riešiť pokojne

[Kopírovať odkaz]
Zverejnené 13. 10. 2014 10:36:01 | | |
Pred spustením aplikačného systému je možné výrazne znížiť chyby a skryté nebezpečenstvá intenzívnym testovaním, ale keďže simulačné prostredie testu nemôže byť presne rovnaké ako skutočné prostredie po spustení systému, testovacia práca nemôže pokryť všetky scenáre produkcie a prevádzky IT aplikačného systému a je ťažké vyhnúť sa výskytu zlyhaní IT aplikačného systému v konkrétnom scenári.
Keďže skryté nebezpečenstvo zlyhania je nevyhnutné, je veľmi dôležité vedieť sa s chybou vyrovnať pokojne! Najlepšie je vedieť vopred, predpovedať možné problémy IT aplikačného systému a prijať opatrenia, keď sa problém nevyskytne, aby sa chyba odstránila v zárodku. Nezáleží na tom, aké zlé to je, musíme čo najskôr vedieť, aké problémy sa v systéme vyskytli a kde sa vyskytli, a riešiť ich včas, skôr než sa rozšíria, aby sme predišli eskalácii situácie. V skutočnosti, pretože tieto dve veci sú stále náročné na dosiahnutie, tlak prevádzky a údržby je bezprecedentný!
Keď sa pozrieme na súčasné podniky s vysokou mierou informačnej konštrukcie zastúpené bankami, rozvoj podnikania je čoraz viac závislý od IT, zložitosť ich IT aplikácií rastie a kontrolovateľnosť sa zhoršuje. Ale čo je problém, je to, že v takej intenzívnej situácii prenasledovania a zachytenia sa stále vyskytujú zlyhania systémov, riziká sa opakovane objavujú a často sa malé problémy nakoniec zmenia na vážne zlyhania – aký je dôvod? Prečo je vždy oneskorenie v objavovaní? Prečo rôzne monitorovacie metódy nedokážu odhaliť abnormality hneď na začiatku? Je potrebné to rozobrať.
Z hľadiska hlavných aspektov je počítačová miestnosť rozdelená do dvoch kategórií: základné zdroje a IT aplikačné systémy. Dlhý čas prikladáme veľký význam základným zdrojom, ako sú sieť, hostiteľ, úložisko, teplota a vlhkosť počítačovej miestnosti, a monitorovacie metódy možno opísať ako "ozbrojené až po zuby".
Na monitorovanie IT aplikačných systémov v súčasnosti domáci aj zahraniční výrobcovia a poskytovatelia služieb poskytujú mnoho produktov alebo riešení, obsah monitorovania má vlastný zameranie, komplexnú analýzu, ich praxou je predovšetkým pozorovanie výkonu IT aplikačného systému na základnej zdrojovej vrstve, prostredníctvom sieťovej prevádzky, výkonu systému, zaneprázdnenosti CPU, obsadenia pamäte, prístupu k databáze, stavu middleware a ďalších indikátorov, v kombinácii s analýzou logov, prieskumom sond, prístupom k simulácii, extrakciou proxy a ďalšími metódami na získanie určitých časových bodov prevádzky systému. Približne posúdime celkový stav prevádzky systému, tieto produkty alebo riešenia postrádajú nepretržité sledovanie a monitorovanie detailov prevádzky systému, takže nedokážu pochopiť detaily o stave prevádzky každého modulu v rámci IT aplikačného systému, ba dokonca ani funkčné body pod modulom, tieto detaily zahŕňajú: Aké transakcie systém spracováva? Ktorý bol úspešný? Čo je problematické? Kto iniciuje transakciu? Kedy bude spustený? Aký biznis robíš? Ktorý modul systému je zapojený? Ktorý funkčný bod je zodpovedný za spracovanie? Kedy sa odpoveď vráti? Existujú nejaké výkonnostné anomálie? Ak to nie je úspešné, aká je chyba? Sú veľmi dôležité na posúdenie prevádzkového stavu IT aplikačného systému.
V praxi, na začiatku zlyhania IT aplikačného systému, keď bod poruchy nemá veľký vplyv na základné zdroje alebo ešte nebol prenesený na základnú vrstvu zdrojov, alebo sa porucha vyskytuje v medzere medzi použitím logov, sond, proxy a iných prostriedkov, hoci systémové riziko bolo "podprúdené", často však existujúce monitorovacie metódy nemôžu zohrávať úlohu a externá prezentácia je tiež "bez abnormality". To je tiež základný dôvod, prečo detekcia chýb zaostáva a je ťažké ju riešiť! Je zrejmé, že včasné odhalenie zlyhaní systémov "prvýkrát" je nedostatkom súčasnej prevádzky a údržby IT a má veľký význam na kompenzáciu prevádzky a údržby IT.
Čo znamená "prvýkrát"? To znamená, že v procese, keď IT aplikačný systém reaguje na požiadavky na prístup, musí byť transakcia presne zaznamenaná v momente, keď transakcia zlyhá alebo nastane abnormálne! Každý vie, že včasné odhalenie je možné riešiť včas, a aby sa zvrátila súčasná pasívna situácia IT prevádzky a kompenzovali nedostatky v prevádzke a údržbe IT, je potrebné technicky vyriešiť problém detekcie zlyhaní systémov "hneď na prvýkrát". Prostredníctvom komparatívneho výskumu a praxe prevádzky veľkého počtu IT aplikačných systémov je táto myšlienka technicky uskutočniteľná, ale ľudia v úrade môžu byť ovplyvnení zotrvačným myslením, nedokážu vystúpiť z pôvodného myslenia a dokonca si myslia, že to nie je uskutočniteľné v subjektívnom vedomí, čo nevedie k žiadnemu podstatnému prelomu v tejto oblasti práce, a prevádzkové riziká IT aplikácií sú vždy v pasívnej situácii jednotlivých reakcií.
Kľúčom k dosiahnutiu "prvýkrát" detekcie zlyhaní systému je byť "ohľaduplný" k IT aplikačnému systému, ovládať každý jeho krok, konkrétne vykonávať dôkladné pozorovanie prevádzkových detailov IT aplikačného systému a prísne monitorovať prevádzku každého modulu a funkčného bodu, pričom toto monitorovanie musí byť zároveň nepretržité a nepretržité, len tak, aby sa neprehliadla žiadna abnormalita systémových transakcií, aby bola prevádzka IT aplikačného systému v kontrolovateľnom stave.
Keďže tento proces dokáže získať a zhromažďovať podrobné informácie o stave prevádzky systému, vytvoriť veľmi hodnotný súbor prevádzky systému, prostredníctvom jeho analýzy a využitia môže nielen slúžiť ako referencia na hodnotenie kvality každého modulu a funkčného bodu, ale aj ako základ pre analýzu vývoja a zmeny prevádzkového stavu systému, čo umožňuje predpovedať trend zdravia IT aplikačného systému.





Predchádzajúci:@天下无双给我们论坛的建议
Budúci:Windows10 je nový a systém stále nie je dostatočne vyspelý
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com