この記事は機械翻訳のミラー記事です。元の記事にジャンプするにはこちらをクリックしてください。
建築家
建築家
リスト
放送
茶屋
インテリジェントAI会話
.NETキャリア&テクニカルカレッジ
ちっちゃいなクズブログ
この版
利用者
Architect_Programmer_Code農業ネットワーク
»
建築家
›
その他の技術
›
サーバー構成
›
ITアプリケーションシステムの障害は避けられず、タイムリーな検出は冷静に対処できます。
眺める:
13098
|
答える:
0
[通信]
ITアプリケーションシステムの障害は避けられず、タイムリーな検出は冷静に対処できます
[リンクをコピー]
管理者
掲載地 2014/10/13 10:36:01
|
|
|
アプリケーションシステムが起動される前は、集中的なテストによって欠陥や隠れた危険を大幅に軽減できますが、テストのシミュレーション環境がシステム起動後の実際の環境と完全に同じではないため、テスト作業はITアプリケーションシステムの生産と運用のすべてのシナリオをカバーできず、特定のシナリオでITアプリケーションシステムの故障を回避するのは困難です。
失敗の隠れた危険は避けられないため、落ち着いて故障に対処できることが非常に重要です! 事前に知り、ITアプリケーションシステムの潜在的な問題を予測し、問題が起きなかったときには不具合を早期に除去するための対策を講じるのが最善です。 どんなに深刻でも、システム内でどのような問題が発生し、どこで発生したのかをできるだけ早く把握し、拡大する前に対処して状況のエスカレーションを防ぐ必要があります。 実際には、これら二つのポイントがまだ難しいため、運用と保守のプレッシャーは前例のないものです!
現在の銀行を中心とした情報構築の多さを持つ企業を見ると、事業開発はますますITに依存し、ITアプリケーションの複雑さはますます高まり、制御性も悪化しています。 しかし、頭痛の種は、これほど激しい追跡・迎撃の状況でもシステムの故障が起こり、リスクが何度もフラッシュし、多くの場合、小さな問題が最終的に大きな故障に発展してしまうことです。その理由は何でしょうか? なぜ発見にいつも遅れがあるのでしょうか? なぜ様々なモニタリング方法が最初から異常を検出できないのでしょうか? これを分析する必要があります。
主要な側面として、コンピュータ室は基本リソースとITアプリケーションシステムの2つのカテゴリーに分かれています。 長い間、ネットワーク、ホスト、ストレージ、コンピュータ室の温度や湿度といった基本的なリソースを非常に重視してきましたが、その監視方法は「完全に武装している」と表現できます。
ITアプリケーションシステムの監視において、現在、国内外のメーカーやサービス提供者が多くの製品やソリューションを提供しています。監視の内容には独自の焦点があり、包括的な分析を行っています。彼らの実践は、ネットワークトラフィック、システム性能、CPUの忙しさ、メモリ占有、データベースアクセス、ミドルウェアの状態などの指標を通じて、基本的なリソース層におけるITアプリケーションシステムのパフォーマンスを観察し、ログ解析、プローブ探索、シミュレーションアクセス、プロキシ抽出などの手法を組み合わせて、システム動作の特定のタイムポイント情報を取得することにあります。 システムの全体的な運用状況を大まかに判断すると、これらの製品やソリューションはシステムの運用詳細の継続的な追跡や監視がないため、ITアプリケーションシステム内の各モジュールの運用状況やモジュール内の機能ポイントの詳細を把握できません。これらの詳細には、システムが処理しているトランザクションは何でしょうか? どちらが成功したのですか? それが問題なのでしょうか? 取引を始めるのは誰ですか? いつ発売されるのですか? どんな商売をしているのですか? どのモジュールが関わっているのでしょうか? どの機能ポイントが処理を担当しているのでしょうか? 返答は何時に返ってきますか? パフォーマンスに異常はありますか? もし成功しなかった場合、その責任は何でしょうか? これらはITアプリケーションシステムの運用状況を判断する上で非常に重要です。
実際には、ITアプリケーションシステムの障害初期、フォールトポイントが基本リソースにほとんど影響を与えないか、まだ基本リソース層に送信されていない場合、またはログ、プローブ、プロキシなどの手段の使用間のギャップで故障が発生する場合、システムリスクは「アンダーカレント」であり、既存の監視手法では役割を果たせず、外部の表示も「異常なし」であることが多いです。 これが故障検出が遅れ、対処が難しい根本的な理由でもあります! 「初めて」のシステム障害のタイムリーな検出は、現在のIT運用・保守作業の欠点であり、IT運用と保守を補うことが非常に重要であることがわかります。
「初めて」って何? つまり、ITアプリケーションシステムがアクセスリクエストに応答する過程で、トランザクションが失敗したり異常に発生した瞬間に正確に記録しなければなりません! 誰もが早期発見は時間をかけて対処できることを知っており、IT運用の受動的な状況を逆転させ、IT運用と保守の欠点を補うためには、システムの故障を「初めて」検出するという問題を技術的に解決する必要があります。 多数のITアプリケーションシステムの運用に関する比較研究と実践を通じて、この考えは技術的には実現可能ですが、局内の人々は慣性的思考に影響され、元の考え方から抜け出せず、主観的意識の中でも実現不可能と考え、この分野の実質的な突破口が生まれず、ITアプリケーションの運用リスクは常に断片的な対応の受動的な状況にあります。
システム障害の「初見」検出を実現する鍵は、ITアプリケーションシステムのあらゆる動きを「配慮」し、そのすべての動きを熟知することです。具体的には、ITアプリケーションシステムの動作詳細を詳細に観察し、各モジュールや機能ポイントの動作を厳格に監視することです。同時に、この監視も継続的かつ途切れなく行われなければなりません。ただし、この方法でシステムトランザクションの異常を見逃さず、ITアプリケーションシステムの動作を制御可能な状態に保つ必要があります。
このプロセスは詳細なシステム運用状況情報を取得・蓄積し、非常に価値のあるシステム運用ファイルを確立できるため、分析と活用を通じて各モジュールや各機能ポイントの品質を判断する基準を提供するだけでなく、システムの発展や運用状況の変化を分析する基盤となり、ITアプリケーションシステムの健全性傾向を予測することが可能になります。
先の:
@天下无双给我们论坛的建议
次に:
Window10は新しく、システムはまだ十分に成熟していません
関連記事
•
Linuxシステムパフォーマンス監視ツール用sysstatチュートリアル
•
Linuxでtcpdumpを使ってdockerコンテナのトラフィックを解析してください
•
Linux 表示:ネットワーク帯域幅使用量(リアルタイムトラフィック)
•
フロントエンドの監視と追跡のためのnavigator.sendBeacon()メソッド
•
LinuxはDockerを用いてNetdataパフォーマンス監視ツールを展開しています
•
Angular 18画像の静的リソース読み込み問題
•
稼働時間Kumaに基づいてウェブサイトの利用可能性を監視してください
•
ChatGPTリソース共有
•
PMM MySQL クエリ解析例のSQL文は不完全です
•
Grafana+Prometheus+Node Exporter fetches Linux server metrics
閲覧したセクション
Windows/Linux
ごみ箱
安全な攻防
簡単な言語/E4A
発表情報
ジャワ
Microsoft SQL Server
その他の番組編成
免責事項:
Code Farmer Networkが発行するすべてのソフトウェア、プログラミング資料、記事は学習および研究目的のみを目的としています。 上記の内容は商業的または違法な目的で使用されてはならず、そうでなければ利用者はすべての結果を負うことになります。 このサイトの情報はインターネットからのものであり、著作権紛争はこのサイトとは関係ありません。 ダウンロード後24時間以内に上記の内容を完全にパソコンから削除してください。 もしこのプログラムを気に入ったら、正規のソフトウェアを支持し、登録を購入し、より良い本物のサービスを受けてください。 もし侵害があれば、メールでご連絡ください。
Mail To:help@itsvse.com