mit Nagios üb erwache ich inzwischen eine ganze Menge. 3Ware-Controller funktionieren mit dem bei den Nagios Plugins mitgelieferten Plugin check_smart.pl sehr gut. Nur mit Highpoint Controller hat das Plugin so seine Probleme. Mit einer kleine Änderung am Code funktioniert aber auch das.
Einfach folgende Zeilen:
syntax("Valid --type entries include ata, scsi and 3ware,n")
unless (($type =~ /^ata$/) || ($type =~ /^scsi$/) || ($type =~ /^3ware,\d+$/));
wie folgt abändern:
syntax("Valid --type entries include ata, scsi, 3ware,n and hpt")
unless (($type =~ /^ata$/) || ($type =~ /^scsi$/) || ($type =~ /^3ware,\d+$/) ||($type =~ /^hpt,\d+\/\d+$/));
mit folgendem Aufruf wird der SMART Check für die Festplatte, welche am ersten Controller und dort am ersten Kanal hängt ausgeführt:
./check_smart.pl --type hpt,1/1 -d /dev/sda -t h
Jeder hat bestimmt schon einmal einen bluescreen bei Windows erlebt oder der PC blieb einfach stehen. Es gibt hierfür viele Ursachen. Ein paar Tips zur Fehlerbehebung möchte ich hier geben.
Falls der PC sich nicht starten läßt, sollte man erstmal zusätzlich eingebaute Hardware wie z.B: Soundkarten, Grafikkarten (falls eine Onboard-Grafikkarte vorhanden ist) wieder ausbauen. Hat das Mainboard keine Onboard-Grafik, kann man die Karte erstmal eingebaut lassen. Es wäre aber praktisch, eine Ersatzkarte parat liegen zu haben. Hilft alles nichts kann man auch alle Laufwerke und sogar die RAM-Riegel entfernen. Hiermit kann man Kurzschlüsse bei Laufwerken bzw. RAM-Fehler ausschliessen. Jetzt sollten nur noch das Mainboard, eventuell eine Grafikkarte und das Netzteil angeschlossen sein. Startet der PC immernoch nicht, hilft vielleicht noch der Wechsel des Netzteiles. Hier muß man darauf achten, das das Netzteil auch ausreichend Strom für die angeschlossenen Komponenten liefert. Läuft das Netzteil an der Grenze und eine neue große Grafikkarte wird eingebaut, läuft der PC wahrscheinlich normal hoch. Wird, wie bei einem aufwendigen Spiel, der Grafikkarte alles abverlangt steigt auch ihr Strombedarf. Ein Absturz ist hier vorprogrammiert. Hilft auch dies nicht is definitiv das Mainboard und/oder die CPU defekt. Bastler, die über Elektronikkenntnisse verfügen können noch die Elko’s auf dem Mainboard überprüfen und gegebenenfalls wechseln. An sonsten kann sich nur noch nach einem neuen Mainboard/CPU umschauen.
Startet der PC und stürzt sporadisch ab kann man mit einer Linux-CD (z.B. Knoppix oder opensuse) den RAM testen. Ich rate von Windows-Programmen ab, da hier nicht der komplette Speicherbereich geprüft werden kann. Der Test sollte mind. eine Stunde laufen. Als nächstes lohnt ein Blick in die Ereignisanzeige unter Windows bzw. in die Log-Dateien von Linux unter /var/log. Defekte Festplatten melden sich z.B. hier mit Log-Einträgen über fehlgeschlagene Lese-/Schreibversuche. Stürzt der PC oft mit einem Bluescreen ab hilft es, sich den gesamten Text aufzuschreiben und sein Glück bei google zu versuchen. Der Fehlercode hilft z.B. dabei das fehlerhafte Gerät bzw. den Treiber zu lokalisieren.