[ English | 日本語 | Deutsch | Indonesia ]

Apa yang harus dilakukan ketika segalanya berjalan lambat

Ketika Anda mendapatkan respons lambat dari berbagai layanan, mungkin sulit untuk mengetahui di mana harus mulai mencari. Hal pertama yang perlu diperiksa adalah tingkat kelambatan: apakah spesifik untuk satu layanan, atau beragam di antara layanan yang berbeda? Jika masalah Anda diisolasi untuk layanan tertentu, sementara itu dapat diperbaiki dengan memulai kembali layanan, tetapi itu seringkali hanya perbaikan untuk gejala dan bukan masalah yang sebenarnya.

Ini adalah kumpulan ide dari operator berpengalaman tentang hal-hal umum untuk dilihat yang mungkin menjadi penyebab kelambatan. Namun, ini tidak dirancang untuk menjadi daftar lengkap.

Layanan OpenStack Identity

Jika OpenStack Identity service merespons dengan lambat, bisa jadi karena tabel token semakin besar. Ini dapat diperbaiki dengan menjalankan perintah keystone-manage token_flush .

Selain itu, untuk masalah yang berkaitan dengan Identitas, cobalah kiat di SQL back end.

Layanan OpenStack Image

OpenStack Image service dapat diperlambat oleh hal-hal yang terkait dengan layanan Identity, tetapi layanan Image itu sendiri dapat diperlambat jika konektivitas ke penyimpanan back-end yang digunakan lambat atau sebaliknya bermasalah. Sebagai contoh, server NFS back-end Anda mungkin sudah turun.

Layanan OpenStack Block Storage

OpenStack Block Storage service mirip dengan layanan Image, jadi mulailah dengan memeriksa layanan yang berhubungan dengan Identity, dan penyimpanan back-end. Selain itu, baik layanan Block Storage dan Image bergantung pada fungsi AMQP dan SQL, jadi pertimbangkan ini saat debugging.

Layanan OpenStack Compute

Layanan yang terkait dengan OpenStack Compute biasanya cukup cepat dan bergantung pada beberapa layanan backend: Identity untuk otentikasi dan otorisasi), dan AMQP untuk interoperabilitas. Setiap kelambatan yang terkait dengan layanan biasanya terkait dengan salah satunya. Juga, seperti semua layanan lainnya, SQL digunakan secara luas.

Layanan OpenStack Networking

Kelambatan pada OpenStack Networking service dapat disebabkan oleh layanan yang diandalkannya, tetapi juga dapat dikaitkan dengan jaringan fisik atau virtual. Misalnya: namespace jaringan yang tidak ada atau tidak terikat ke interface dengan benar; Daemon DHCP yang telah hang atau tidak berjalan; kabel terputus secara fisik; sebuah switch tidak dikonfigurasikan dengan benar. Ketika debugging masalah layanan Networking, mulailah dengan memverifikasi semua fungsi jaringan fisik (konfigurasi switch, kabel fisik, dll.). Setelah jaringan fisik diverifikasi, periksa untuk memastikan semua layanan Networking berjalan (neutron-server, neutron-dhcp-agent, dll.), Lalu periksa AMQP dan SQL back end.

AMQP broker

Terlepas dari broker AMQP mana yang Anda gunakan, seperti RabbitMQ, ada masalah umum yang tidak hanya memperlambat operasi, tetapi juga dapat menyebabkan masalah nyata. Terkadang pesan yang antri untuk layanan tetap berada di antrian dan tidak digunakan. Ini bisa disebabkan oleh layanan mati atau stagnan dan biasanya dapat diselesaikan dengan me-restart layanan terkait AMQP atau layanan OpenStack yang bersangkutan.

SQL back end

Apakah Anda menggunakan SQLite atau RDBMS (seperti MySQL), interoperabilitas SQL sangat penting untuk lingkungan OpenStack yang berfungsi. File SQLite yang besar atau terfragmentasi dapat menyebabkan kelambatan saat menggunakan file sebagai ujung belakang. Kueri yang terkunci atau berjalan lama dapat menyebabkan penundaan untuk sebagian besar layanan RDBMS. Dalam hal ini, jangan langsung membunuh kueri, tetapi periksa ke dalamnya untuk melihat apakah itu adalah masalah dengan sesuatu yang digantung, atau sesuatu yang hanya membutuhkan waktu lama untuk dijalankan dan harus selesai sendiri. Administrasi RDBMS berada di luar ruang lingkup dokumen ini, tetapi harus dicatat bahwa RDBMS yang berfungsi dengan baik sangat penting untuk sebagian besar layanan OpenStack.