[ English | 日本語 | Deutsch | Indonesia ]

完全な故障の対処

データセンターの電源障害など、完全なシステム障害からリカバリーする一般的な方法は、各サービスに優先度を付け、順番に復旧していくことです。 表: サービス復旧優先度一覧の例 に例を示します。

表: サービス復旧優先度一覧の例

優先度

サービス

1

内部ネットワーク接続性

2

バックエンドのストレージサービス

3

ユーザーの仮想マシンに対するパブリックネットワーク接続性

4

nova-compute, cinder ホスト

5

ユーザーの仮想マシン

10

メッセージキューとデータベースのサービス

15

Keystone サービス

20

cinder-scheduler

21

イメージカタログとイメージ配信のサービス

22

nova-scheduler サービス

98

cinder-api

99

nova-api サービス

100

ダッシュボードサービス

この例にある優先度一覧を使用すると、きちんと安定した状態になる前であっても、できる限り早くユーザーに影響するサービスを復旧させることができます。もちろん、1 行の項目として一覧化されていますが、各ステップは多大な作業が必要です。たとえば、データベースを開始した後、その完全性を確認すべきです。また、nova サービスを開始した後、ハイパーバイザーがデータベースに一致しているかを確認し、不一致があれば修正すべきです。