[ English | 日本語 | Deutsch | Indonesia ]

Kegagalan Pengontrol Cloud dan Proksi Penyimpanan dan Pemeliharaan

Pengontrol cloud dan proksi penyimpanan sangat mirip satu sama lain dalam hal penghentian yang diharapkan dan tidak terduga. Salah satu dari setiap jenis server biasanya berjalan di cloud, yang membuat mereka sangat terlihat ketika mereka tidak berjalan.

Untuk pengendali cloud, kabar baiknya adalah jika cloud Anda menggunakan mode jaringan HA multi-host FlatDHCP, instance dan volume yang ada terus beroperasi saat pengendali cloud sedang offline. Untuk proksi penyimpanan, bagaimanapun, tidak ada lalu lintas penyimpanan yang mungkin sampai itu kembali dan berjalan.

Planned Maintenance

Salah satu cara untuk merencanakan pengontrol cloud atau pemeliharaan proksi penyimpanan adalah dengan melakukannya di luar jam, seperti pada pukul 1 atau 2 pagi. Strategi ini memengaruhi lebih sedikit pengguna. Jika pengontrol cloud atau proksi penyimpanan Anda terlalu penting untuk tidak tersedia kapan pun, Anda harus melihat ke opsi ketersediaan tinggi.

Reboot Pengontrol Cloud atau Proksi Penyimpanan

Secara keseluruhan, cukup terbitkan perintah reboot . Sistem operasi dengan bersih mematikan layanan dan kemudian secara otomatis reboot. Jika Anda ingin sangat teliti, jalankan pekerjaan cadangan Anda tepat sebelum Anda reboot.

Setelah pengontrol cloud dinyalakan ulang, pastikan semua layanan yang diperlukan berhasil dimulai. Perintah berikut menggunakan ps dan grep untuk menentukan apakah nova, glance, dan keystone saat ini sedang berjalan:

# ps aux | grep nova-
# ps aux | grep glance-
# ps aux | grep keystone
# ps aux | grep cinder

Periksa juga apakah semua layanan berfungsi. Set perintah berikut sumber file openrc, kemudian menjalankan beberapa perintah dasar glance, nova, dan openstack. Jika perintah berfungsi seperti yang diharapkan, Anda dapat yakin bahwa layanan tersebut dalam kondisi kerja:

# . openrc
# openstack image list
# openstack server list
# openstack project list

Untuk proxy penyimpanan, pastikan bahwa Object Storage service telah dilanjutkan:

# ps aux | grep swift

Juga periksa apakah berfungsi:

# swift stat

Total Kegagalan Pengontrol Cloud

Pengontrol cloud bisa gagal total, misalnya, motherboard-nya rusak. Pengguna akan segera melihat hilangnya pengontrol cloud karena menyediakan fungsionalitas inti ke lingkungan cloud Anda. Jika pemantauan infrastruktur Anda tidak memberi tahu Anda bahwa pengendali cloud Anda telah gagal, pengguna Anda pasti akan melakukannya. Sayangnya, ini adalah situasi yang sulit. Pengontrol cloud adalah bagian integral dari cloud Anda. Jika Anda hanya memiliki satu pengontrol, Anda akan memiliki banyak layanan yang hilang jika turun.

Untuk menghindari situasi ini, buat kluster pengendali cloud yang sangat tersedia. Ini di luar ruang lingkup dokumen ini, tetapi Anda dapat membaca lebih lanjut di OpenStack High Availability Guide.

Pendekatan terbaik berikutnya adalah menggunakan alat manajemen konfigurasi, seperti Puppet, untuk secara otomatis membangun pengendali cloud. Seharusnya tidak lebih dari 15 menit jika Anda memiliki server cadangan. Setelah pengontrol membangun kembali, pulihkan semua cadangan yang diambil (lihat Cadangan dan Pemulihan).

Juga, dalam praktiknya, layanan nova-compute pada node komputasi tidak selalu terhubung kembali dengan bersih ke rabbitmq yang dihosting pada pengontrol ketika ia kembali setelah boot ulang yang panjang; diperlukan restart layanan nova pada node komputasi.