Pertanyaan “Mce: [Kesalahan Perangkat Keras]: Peristiwa pemeriksaan mesin dicatat” muncul di syslog. Apa yang harus saya lakukan?


Saya telah menginstal versi terbaru dari OSSEC (2.8.1) dan saya juga telah mengaktifkan pemberitahuan email. Dan saya mendapatkan banyak pemberitahuan semacam ini yang mengatakan bahwa ada Kesalahan Perangkat Keras dan sesuatu tentang mce:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

Jadi apa sebenarnya artinya ini? Apa mce berdiri? Dan apakah ini jelas kesalahan hardware apa yang harus saya khawatirkan?


Informasi OS:

Description:    Ubuntu 14.10
Release:    14.10

18
2018-04-04 19:37


asal


Anda perlu melakukan sedikit membaca di ossec, lihat aturan - ossec-docs.readthedocs.org/en/latest/manual/rules-decoders . Antarmuka web membantu karena memiliki sejumlah penjelasan - ossec.net/wiki/index.php/OSSECWUI:Install - Panther
ossec-docs.readthedocs.org/en/latest/faq/… - Panther
ossec mungkin kurang didukung atau di luar topik di sini karena tidak ada di repositori ubuntu - Panther
Ini bukan tentang OSSEC sama sekali. Anda mendapat pemberitahuan itu karena OSSEC menemukan kata "kesalahan" di syslog. Meskipun saya tidak berpikir itu di luar topik, Anda mungkin akan mendapatkan bentuk bantuan lebih banyak Unix & Linux atau Kesalahan Server. - Eric Carvalho
@ bodhi.zazen Semua yang harus dilakukan untuk berada di topik dijalankan di Ubuntu. Sekarang bukan berarti Anda akan mendapatkan jawaban tentu saja. - Seth♦


Jawaban:


Pengecekan Mesin Pemeriksaan:

SEBUAH Mesin Periksa Pengecualian (MCE) adalah jenis perangkat keras komputer   kesalahan yang terjadi ketika unit pemrosesan pusat komputer mendeteksi a   masalah perangkat keras.

Komputer Anda mengalami kesalahan perangkat keras dan kernel mencatat peristiwa di buffer. Kamu dapat memakai mcelog untuk mencatat dan melihat peristiwa pemeriksaan mesin. Dari mcelog manpage:

Kesalahan laporan CPU X86 terdeteksi oleh CPU sebagai peristiwa pemeriksaan mesin   (MCE). Ini dapat berupa data korupsi yang terdeteksi dalam cache CPU, di   memori utama oleh pengontrol memori terintegrasi, kesalahan transfer data   di bus sisi depan atau interkoneksi CPU atau kesalahan internal lainnya.   Kemungkinan penyebabnya bisa berupa radiasi kosmis, pasokan listrik yang tidak stabil,   masalah pendinginan, perangkat keras yang rusak, menjalankan sistem dari   spesifikasi, atau nasib buruk.

Kebanyakan kesalahan dapat dikoreksi oleh CPU dengan koreksi kesalahan internal   mekanisme. Kesalahan yang tidak dikoreksi menyebabkan pengecualian pemeriksaan mesin   dapat membunuh proses atau membuat mesin panik. Sejumlah kecil dikoreksi   kesalahan biasanya bukan alasan untuk khawatir, tetapi sejumlah besar bisa   menunjukkan kegagalan di masa depan.

Ketika kesalahan diperbaiki atau pulih terjadi, kernel x86 menulis a   catatan yang menggambarkan MCE ke dalam buffer cincin internal yang tersedia   melalui perangkat / dev / mcelog. misogog mengambil kesalahan dari   / dev / mcelog, menerjemahkannya ke dalam format yang dapat dibaca manusia dan mencetaknya   pada output standar atau secara opsional ke dalam log sistem.

Jika Anda tidak melihat ada kerusakan, mungkin kesalahan itu berhasil diperbaiki. Namun, saya menyarankan Anda untuk menginstal mcelog untuk melacak kejadian seperti itu:

sudo apt-get install mcelog

Peristiwa akan dicatat /var/log/mcelog. Anda juga dapat menjalankan:

sudo mcelog --client

untuk query mcelog daemon untuk kesalahan.


21
2018-04-11 21:22



Saya bertanya-tanya mengapa kesalahan MCE tidak hanya ditulis langsung ke log sistem ... mungkin beberapa alasan yang bagus, mungkin - Xen2050
@ Xen2050 Karena decoding pesan bergantung pada arsitektur dan tidak selalu didokumentasikan oleh produsen perangkat keras. Kesalahan bisa dihasilkan bahkan oleh PCIe bus. - Mircea Vutcovici
@ Xen2050: Pada mesin Fedora 25 saya, pesan MCE ditulis ke jurnal, saya bisa melihatnya journalctl -b. - Martin Ueding