Go to Top

Basic Tutorial: Datenverlust – Was wird wirklich auf einer HDD gespeichert?

Datenverlust

Die Grundidee der IT-Daten ist sehr abstrakt und wird in der Regel in einer unattraktiven und langweiligen Art und Weise beschrieben. Aber in der Realität sind die meisten der auf den Festplatten gespeicherten Daten entweder persönlich, für uns wichtig oder oft einfach einzigartig. Unabhängig davon, ob es sich um Ihre Urlaubsfotos, Lieblingsfilme und Musik oder um das Ergebnis Ihrer harten Arbeit handelt, der Wert Ihrer Festplatte ist gleichbedeutend mit dem Wert der Daten, die auf ihr gespeichert sind.

Vor fast 35 Jahren kam ein kleines Unternehmen namens Kroll Ontrack auf den Markt, mit einem Programm, das es damals ermöglichte größere Festplatten – mit bis zu 40 Megabytes – zu installieren. (Ja, das war damals viel Platz…) Aber aus welchem Grund hat Kroll Ontrack dann später sein Geschäftsfeld gewechselt? Weil auch wir unsere Daten verloren haben… Aber das ist eine andere Geschichte…

Wo sind meine Daten? Ein Puzzle für Detektive…

Unabhängig davon, ob Sie Ihre Bilder, Videos, E-Books, Diplomarbeiten speichern oder Sie der Administrator einer Server-Hosting-Website und/oder einer riesiger Datenbank sind, die eigentlichen Daten befinden sich zunächst nicht auf Ihrem Speichermedium, sondern erstmal nur die Informationen zu den Daten, auch als Dateiverzeichnis bekannt. Deshalb ist es bei einem Datenverlust meistens so, dass jeder Versuch, der durch das System unternommen wird, um konkret festzustellen wo eine bestimmte Datei auf einer Festplatte tatsächlich gespeichert ist, scheitert. Denn die digitalen Informationen einer Datei wurden über die gesamte Festplatte (und manchmal sogar über mehrere Festplatten) verteilt. Zusätzlich kann auch jedes dieser Informations-Teilchen sogar mehr als einmal aufgezeichnet werden.

„Jedem von uns ist wahrscheinlich mehr oder weniger bekannt, dass die digitale Technologie Daten in einem binären System, also als eine Zeichenfolge von Nullen und Einsen, abspeichert. Aber eigentlich ist das nicht ganz richtig! Was für uns eine logische Null oder Eins darstellt, ist in Wirklichkeit eine Struktur von elektronischen Molekülen auf der Oberfläche der Festplatte. Beim Schweben über der Platte zeichnet der Magnetkopf die hohen oder niedrigen Werte des aufgefangenen Signals auf. Diese Information wird dann anschließend von dem elektronischen System verarbeitet“, erklärt Robin England, Senior Forschungs- und Entwicklungsingenieur bei Kroll Ontrack UK.

Robin England

 

Codierung – The „Inception“/ Der Beginn jeder Festplatte

Bevor die Informationen über unsere Dateien in der Form einer Magnetspur auf der Festplatte gespeichert wird, muss sie zuvor codiert werden. In einer modernen Festplatte werden mindestens 5 Stufen der Codierung verwendet. Es erinnert mich an den Film „Inception“ mit Leonardo DiCaprio, in dem der Hauptdarsteller in immer tiefere Ebenen der surrealen Wirklichkeit tritt.

Im Falle einer HDD ist das absolut notwendig. Aber warum müssen die Informationen so oft codiert werden, bevor sie auf eine Festplatte geschrieben werden können? Die Codierung gewährleistet, dass die Fragmente, die von der Platte gelesen werden, eindeutig zuzuordnen sein werden. Darüber hinaus sind bestimmte Arten der Codierung für die Korrektur von Lesefehlern verantwortlich, die eventuell während der Aufnahme und dem anschließenden Auslesen der Daten auftreten und tragen zur Minimierung der Suchzeit bei.

Besonders interessant bei den verschiedenen Codierungsarten ist der sogenannte Scrambler, der einen Zufallscode generiert. Anders gesagt werden hier die Bit-Folgen zufällig gemischt (in Wirklichkeit handelt es sich zwar um pseudo-zufällig, weil die Zufälligkeit ja aufgrund eines eingesetzten Algorithmus erzeugt wird, aber egal…)

Warum? Es stellt sich dabei heraus, dass die ursprünglich codierten Daten, die die Informationen mit den gleichen sich wiederholenden Strukturen (Pattern) und die – wenn sie direkt auf die Festplatte geschrieben würden – mehrere sich wiederholende magnetische Folgen (Strings) erzeugen. Diese Muster würden dann den Lesekopf bei der Suche nach einer bestimmten Zeichenfolge täuschen.

Allerdings, selbst diese Randomisierung schließt störende magnetische Muster nicht aus. Ein gutes Beispiel eines solchen Musters ist eine Serie von Nullen. Diese Nullen würden eine „Kein-Signal-Zone“ darstellen, die nicht korrekt gelesen werden könnte. Daher ist es notwendig den nächsten Code einzuführen, den RLL, der sicherstellt, dass der Datensatz nicht mehr Nullen besitzt als er sollte. (Beim 16Bit-Code sind das 10 bis 15 Nullen).

Schutz gegen Fehler

Codierung ist also notwendig, um einen maximalen Schutz gegen Fehler zu gewährleisten. Obwohl die magnetische Aufzeichnung für zahlreiche Fehler und Beschädigungen anfällig ist, liegt die durchschnittliche Fehler-Wahrscheinlichkeit bei weniger als 10 -13, ist also sehr selten. Um solche Ergebnisse zu erreichen, wird noch weitere Codierung verwendet. Der Error Correction Code (ECC) berechnet Paare von Bits, die beim Codieren verwendet werden können, um Fehler erkennen und beheben zu können.

Wie man sieht, ist die Beziehung zwischen einer Datei und der Information, die auf der Festplatte gespeichert wird, äußerst komplex. Selbst wenn wir das Festplatten-Abbild nach einem Ausfall des Originalmediums wiederherstellen können, müssen wir als Datenretter trotzdem die richtigen Werkzeuge und das passende Wissen zur Verfügung haben, um die Daten richtig zu dekodieren. Wenn die ausgefallene Festplatte zuvor auch noch verschlüsselt wurde, stehen wir vor einer weiteren Herausforderung und hier kann es manchmal auch völlig unmöglich sein, die ursprünglichen Daten wiederherzustellen, da sich die Verschlüsselung nicht beheben und umgehen lässt.

Im nächsten Beitrag dieser Serie erläutere ich wo die Dateien auf einer Festplatte wirklich gespeichert werden. Bleiben Sie einfach dabei!