完全な故障の対処¶

データセンターの電源障害など、完全なシステム障害からリカバリーする一般的な方法は、各サービスに優先度を付け、順番に復旧していくことです。表: サービス復旧優先度一覧の例に例を示します。

表: サービス復旧優先度一覧の例¶
優先度	サービス
1	内部ネットワーク接続性
2	バックエンドのストレージサービス
3	ユーザーの仮想マシンに対するパブリックネットワーク接続性
4	`nova-compute`, cinder ホスト
5	ユーザーの仮想マシン
10	メッセージキューとデータベースのサービス
15	Keystone サービス
20	`cinder-scheduler`
21	イメージカタログとイメージ配信のサービス
22	`nova-scheduler` サービス
98	`cinder-api`
99	`nova-api` サービス
100	ダッシュボードサービス

この例にある優先度一覧を使用すると、きちんと安定した状態になる前であっても、できる限り早くユーザーに影響するサービスを復旧させることができます。もちろん、1 行の項目として一覧化されていますが、各ステップは多大な作業が必要です。たとえば、データベースを開始した後、その完全性を確認すべきです。また、nova サービスを開始した後、ハイパーバイザーがデータベースに一致しているかを確認し、不一致があれば修正すべきです。

完全な故障の対処

完全な故障の対処¶

operations-guide 2013.2.1.dev1230