fehlgeschlagene RAID Prüfung

Aus unbekannten Gründen ist mein NAS gestern Abend stehen geblieben. Sauber herunterfahren wollte es sich auch nicht, also blieb mir nur den Stecker zu ziehen. Das jedoch ist bei einem RAID (ich fahre ein RAID5 mit 4 Platten) eine weniger gute Idee, weil damit unter Umständen sich im Schreibvorgang befindliche Dateien noch unerledigt im RAID-Controller befinden können. Mir blieb aber augenscheinlich nichts anderes übrig.

Der manuelle Neustart des NAS mündete in der erwarteten Meldung auf der Verwaltungsoberfläche, dass das Dateisystem möglicherweise ‘unclean’ sein könnte und man eine Prüfung des RAID laufen lassen sollte. In der Verwaltungsoberfläche NAS gibt es dafür eine Funktion.

Vor der Prüfung schaltet man zur Sicherheit alle auf dem NAS laufenden Tools und Services ab, damit es während der Prüfung nicht zu neuen Schreibvorgängen kommen kann, das könnte weitere unerwünschte Nebeneffekte mit sich ziehen. Nach etwa 5 Minuten jedoch meldete sich das NAS mit dem lapidarem Fehler:

[RAID5 Disk Volume: Drive 1 2 3 4] Examination failed(Cannot unmount disk by utilReque).

Mehr nicht. Panik ist erst einmal nicht von Nöten, doch ist es rätselhaft warum genau die Prüfung fehlschlägt. Wenn man etwas Linux beherrscht weiss man, dass der Unmount einer Platte immer dann fehlschlägt, wenn noch ein Dienst auf die Platte zugreift, oder ein Schreibvorgang just gerade stattfindet, die Platte wird als “busy” gekennzeichnet. Ich vermutete also einen weiterhin im Hintergrund laufenden Service, der den Unmount des RAIDs verursacht. Nur welcher?

Da die Verwaltungsoberfläche des QNAP NAS hier nicht mehr hilfreich ist, wechselte ich auf die Konsole (ssh admin@%IP_DES_NAS Linux und Mac User können das mit Boardmitteln machen, Windows-Nutzer müssen sich puttY installieren) und dort weiter zu suchen. Auf dem NAS läuft ein angepasstes Linux, also helfen die üblichen Kommandos sich die einzelnen Prozesse und Dienste anzusehen. Mithilfe des Kommandos “top” konnte ich einen immer noch laufenden FTP-Dienst ausmachen. Der lies sich zwar ‘killen’ doch startet der immer wieder. Tante Google brachte letztlich die Lösung:

Bildschirmfoto 2014 09 23 um 08 42 22

(quelle: http://www.mrbuckykat.com)

Danach lief die Überprüfung des RAID fehlerfrei durch, es wurden alle ‘offene’ Schreibvorgänge abgeschlossen, das DateiSystem gesäubert und alles ist wieder fein. 

In dem Zusammenhang: Es hätte auch schief gehen und das Dateisystem des RAID hätte einen irreparablen Defekt davontragen können. In einem solchen Desaster muss man das RAID neu aufbauen und alle Dateien auf dem NAS gehen verloren.

Daher gilt: Ein RAID-System sorgt nur für eine verbesserte Ausfallsicherheit/Verfügbarkeit von Daten, es ersetzt kein Backup!

2 Gedanken zu „fehlgeschlagene RAID Prüfung

  1. Wie wahr. Anfang des Jahres habe ich es geschafft mein RAID5 zu killen. Ich wollte es um eine Platte erweitern, die sich leider als defekt erwies. Aber leider erst als der Erweiterungsvorgang abgeschlossen war. Kein Problem, sollte man meinen, dafür habe ich ja ein RAID. Aber just in diesem Moment ist eine der vorhandenen Platten zusätzlich gestorben. Damit war dann alles über den Jordan. Und alles wofür es kein Backup gab, ward verloren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.