完全な故障の対処

完全な故障の対処

データセンターの電源障害など、完全なシステム障害からリカバリーする一般的な方法は、各サービスに優先度を付け、順番に復旧していくことです。 表: サービス復旧優先度一覧の例 に例を示します。

表: サービス復旧優先度一覧の例
優先度 サービス
1 内部ネットワーク接続性
2 バックエンドのストレージサービス
3 ユーザーの仮想マシンに対するパブリックネットワーク接続性
4 nova-compute, cinder ホスト
5 ユーザーの仮想マシン
10 メッセージキューとデータベースのサービス
15 Keystone サービス
20 cinder-scheduler
21 イメージカタログとイメージ配信のサービス
22 nova-scheduler サービス
98 cinder-api
99 nova-api サービス
100 ダッシュボードサービス

この例にある優先度一覧を使用すると、きちんと安定した状態になる前であっても、できる限り早くユーザーに影響するサービスを復旧させることができます。もちろん、1 行の項目として一覧化されていますが、各ステップは多大な作業が必要です。たとえば、データベースを開始した後、その完全性を確認すべきです。また、nova サービスを開始した後、ハイパーバイザーがデータベースに一致しているかを確認し、不一致があれば修正すべきです。

Creative Commons Attribution 3.0 License

Except where otherwise noted, this document is licensed under Creative Commons Attribution 3.0 License. See all OpenStack Legal Documents.