Go to Top

Was steckt hinter „Big Data“?

Big Data ist ein Kunstbegriff, der verwendet wird, um eine große zu verarbeitende Menge an strukturierten, teil-strukturierten und unstrukturierten Daten zu beschreiben.

Big Data wird charakterisiert durch die extreme Datenmenge, eine Vielzahl von Datentypen und die Geschwindigkeit, mit der die Daten verarbeitet werden müssen. Obwohl sich der Begriff „Big Data“ nicht auf eine bestimmte Menge bezieht, wird er oft für Petabyte oder Exabyte an Daten verwendet.

Diese riesigen Mengen an Daten können nicht so einfach verarbeitet werden, weil es zu viel Zeit und Geld kosten würde, um alle Daten für die Analyse in eine traditionelle relationale Datenbank zu laden. Daher sind neue Ansätze zur Speicherung und Analyse entstanden, die sich weniger auf Datenschemata und Datenqualität beziehen. So können große Mengen an Rohdaten (inklusive erweiterter Metadaten) in einem Daten-See (Data Lake) gesammelt werden, aus dem lernfähige Programme mit künstlicher Intelligenz (KI) und komplexen Algorithmen Dateien entnehmen können, um sie klassischen Weiterverarbeitungsszenarien zuzuführen.

Obwohl die Nachfrage nach Big-Data-Analysen hoch ist, gibt es derzeit einen Mangel an Wissenschaftlern und andere Analysten, die Erfahrung mit der Arbeit mit Big Data haben. Dieser Mangel wurde versucht, durch die Programmierung von Anwendungen zu kompensieren, um Unternehmen bei der Auswertung ihrer halb-strukturierten und unstrukturierten Daten zu unterstützen.

Landläufig wird heute mit dem Begriff „Big Data“ der gesamte Komplex des Sammelns und Auswertens großer Datenmengen verbunden – und ist eher negativ besetzt. Besonders das Speichern von privaten Daten ist durch die in letzter Zeit bekannt gewordenen Abhöraffären ins Gerede gekommen. Auch die Aufgabenstellung der Wissenschaft hat sich gewandelt: wo früher mit einer konkreten Fragestellung als Ausgangsmaterial Daten erhoben wurden werden heute Daten gesammelt und dann überlegt man sich die dazu passenden Fragen. So die Meinung vieler Wissenschaftler, die dieser Entwicklung nicht unbedingt wohlwollend gegenüberstehen.

Bildquelle: Camelia.boban / wikipedia