Go to Top

Kürzlich abgeschlossener Fall zeigt: Rettung eines modernen NAS Servers ist ein sehr komplexes Unterfangen

Datenrettung NAS

Sie denken die Wiederherstellung eines „simplen“ Network Attached Storage (NAS) Servers ist eine einfache Aufgabe? NAS Server sind zwar kostengünstige RAID-basierte Speichersysteme, die für kleine bis mittlere Unternehmen konzipiert sind, aber sie sind heutzutage technisch fast genau so komplex und schwierig wiederherzustellen wie (die teureren) High-End-Produkte von EMC, Dell, HP und anderen. Da die meisten dieser „kleinen“ Speicher nunmehr fortschrittliche Funktionen der High-End-Versionen wie Deduplizierung, Unterstützung von Virtualisierung, iSCSI-Targeting und anderes enthalten, sind ihre Daten auf vielen verschiedenen Schichten strukturiert, die eine nach der anderen wiederhergestellt und restrukturiert werden müssen, um schließlich zu den „echten“ Dateien zu gelangen.

Dies war beispielsweise der Fall, als kürzlich ein Kunde des deutschen Kroll Ontrack Labors einen Ausfall seines QNAP NAS erlebte. Das RAID 6-basierte System bestand aus 24 Festplatten mit einer Kapazität von jeweils 6 Terabyte. Während des originalen Setups wurden zwei iSCSI-LUNs erstellt, die mehr als 40 bzw. 60 Terabyte Daten enthielten. Jede LUN war ein iSCSI-Target eines Windows Server 2012 R2-Systems und als NTFS-Partition formatiert. Darüber hinaus wurde die Deduplizierungsfunktion von Windows Server 2012 R2 auf beiden LUNs eingesetzt. Als dann der Kunde – eine IT-Abteilung einer großen Immobiliengruppe – ein träges Verhalten seines NAS bemerkte, „löste“ er das Problem, indem er das System „hart“ ausschaltete. (Also ohne das System richtig herunterzufahren.) Das Resultat dieser Entscheidung war, dass nach dem Neustart auf die beiden LUNs nicht mehr zugegriffen werden konnte, obwohl die Laufwerksbuchstaben angezeigt wurden. Und noch viel schlimmer für den Kunden: Es gab überhaupt kein aktuelles Backup der auf dem NAS gespeicherten Daten!

An dieser Stelle kontaktierte der Kunde den Datenrettungsspezialisten Kroll Ontrack. Nachdem die Experten die Festplatten erhalten hatten, ergab die Analyse des Falles, dass beim anschließenden Datenrettungsprozess insgesamt sechs verschiedene Schichten an Datenstrukturen nacheinander bearbeitet werden mussten. Da ein QNAP NAS mit einem Linux-Datensystem arbeitet, mussten die Spezialisten zunächst die QNAP NAS RAID 6-Schicht rekonstruieren, um zum Linux EXT4 Dateisystem zu gelangen. In diesem EXT4-Dateisystem waren Fragmente der fehlenden LUNs enthalten und mussten neu aufgebaut werden, um auf die 64 Terabyte bzw. 44 Terabyte Roh-LUN-Daten zugreifen zu können. Die Größe der einzelnen Fragmente betrug etwa 1 TB, so dass mehr als 100 große „iSCSI Stücke“ behandelt, strukturiert und zusammengestellt werden mussten, um die beiden iSCSI LUN-Dateien wieder zusammenzusetzen.

Diese iSCSI-Fragmente wurden ursprünglich vom QNAP-System verwaltet und on-the-fly zusammengesetzt, so dass das Windows Server-System glaubte, dass es auf zwei real vorhandene LUNs zugreifen kann. Die Datenrettungsexperten waren in der Lage, diese iSCSI-LUN-Dateien in ein einziges NTFS-Volume zusammenzufassen, nachdem zuvor die iSCSI-Dateien blockweise in einen temporären SSD-Speicher kopiert wurden. Da bei dem System auch die Deduplizierung der beiden Windows Server aktiviert war, mussten die Ingenieure die sechste und letzte Schicht bearbeiten und herausfinden, welche Dateien von dieser Funktion betroffen waren, um als Ergebnis ein NTFS-Volume zu erstellen, das der Kunde am Ende verwenden konnte. Dieses NTFS-Volume wurde dann aus dem temporären SSD-Speicher auf ein neu erworbenes RAID-Speichersystem kopiert, das der Client einfach an sein Netzwerk anschließen konnte und wieder auf die Daten zugreifen konnte.

Selbst mit den hoch spezialisierten und selbst entwickelten Recovery Tools von Kroll Ontrack dauerte die Wiederherstellung und das Kopieren dieser unglaublich großen Datenmenge auf den neuen Backup-Speicher mehrere Wochen. Die abschließende Analyse dieses großen Datenrettungsfalls durch die Kroll Ontrack Experten zeigte deutlich, dass offensichtlich der NAS-Server am Anfang nicht korrekt eingerichtet wurde, nachdem er in Betrieb genommen worden war. Und genau dies könnte auch der Grund für seinen Ausfall gewesen sein. Wie dargestellt, dauert eine Wiederherstellung – aufgrund der riesigen Menge an Daten, die auf dem Server gespeichert waren – eben auch seine Zeit. Daher ist es sehr wichtig, einen NAS-Server korrekt einzurichten, bevor er mit wichtigen Daten gefüllt wird. Darüber hinaus ist es klug, für Datenverlust-Situationen wie diese gewappnet zu sein und einen Plan für den Ernstfall vorbereitet zu haben.

Dieser Datenverlust-Fall zeigt auch: Obwohl ein solches NAS-System viele fortschrittliche Funktionen aufweist, sollten trotzdem nicht alle davon ungeprüft genutzt werden, da kleine bis mittlere Server wie das hier dargestellte eben definitiv nicht so ausfallsicher sind wie die High-End-Produkte der teureren Hersteller. So war in diesem Fall die Verwendung der Deduplizierungsfunktion möglicherweise keine so gute Idee gewesen, da es am Ende die Datenrettung nochmals komplexer als notwendig gemacht hatte. Und da Festplatten für ein solches System in den letzten Jahren immer günstiger geworden sind, wäre es vielleicht besser gewesen, zusätzliche Platten zu kaufen und einzusetzen, anstatt die Datenstruktur unnötigerweise noch komplexer zu machen und damit zu riskieren, dass sogar Datenrettungsexperten eines Tages nicht mehr in einem überschaubaren Zeitrahmen und zu vertretbaren Kosten helfen können.

Bildnachweis: Paul-Georg Meister  / pixelio.de