Go to Top

Big Data: Anwendungen und eingesetzte Technologien – Teil 1

Big Data

Kaum ein Thema wird derzeit so intensiv besprochen wie Big Data. Gilt es doch aus der Fülle der heutzutage aus vielen Quellen gesammelten Daten und Informationen sinnvolle Handlungsanweisungen, neue Strategien oder bessere Geschäftsmöglichkeiten zu generieren. Dabei ist das Sammeln von Daten sowie die Analyse vorhandener Daten eigentlich ein alter Hut. Bereits seit den Anfängen der Computerisierung werden Daten gesammelt und ausgewertet. Was neu ist, ist die Möglichkeit mit modernen Business Intelligence Applikationen die Analyse der Daten in Echtzeit durchzuführen. Ein gutes Beispiel ist die Erhebung von Daten aus dem Computerhandel. Das, was Bloomberg mit seiner nahtlosen Verzahnung verschiedener Business Intelligence (BI), Informations- und Transaktionsprogrammen den Händlern anbietet, ist Big Data in Reinkultur.

Aber was Big Data eben auch ausmacht, ist die Möglichkeit unstrukturierte – also bisher nicht aufbereitete – Daten in die BI-Programme zu integrieren und mit ihnen Analysen durchzuführen, die zu konkreten Ergebnissen führen sollen. Dabei gibt es heute bereits unzählige Anwendungsmöglichkeiten von Big Data Sammlungen und Analysen, die konkrete Auswirkungen auf Kunden oder Anbieter von Produkten oder Dienstleistungen haben. So ermitteln Finanzdienstleister anhand aller eingehenden Daten ihr eigenes Risiko mittels der Risk und Portfolio Analysis oder schätzen die Möglichkeiten eines neuen Finanzproduktes anhand der derzeitigen Situation ein. Fernsehanstalten und Werbetreibende können anhand der eingehenden Daten in Echtzeit die Werbewirksamkeit ihrer Online- und Offline-Kampagnen messen und gegebenenfalls anpassen. Und schließlich können Automobilhersteller sich mittels eingebauten Sensoren und Sendern über den Zustand eines Fahrzeuges oder seiner eingebauten Teile detailliert informieren.

Generell kann man den Einsatz von Big Data Anwendungen grob in drei verschiedene Kategorien einteilen:

  1. Kundenorientiert: Entwicklung neuer Produktideen/Dienstleistungen, besseres Kundenverständnis/Verbesserung der Kundenerfahrung
  2. Geschäftsorientiert: Entwicklung neuer Geschäftsmodelle, besseres Verständnis des Marktes/Wettbewerbs
  3. Unternehmensorientiert: Kostenreduktion bei Betriebsmitteln etc., Erhöhung des Umsatzes, Beschleunigung von Entscheidungen, bessere Steuerung operativer Prozesse und bessere strategische Entscheidungen

Allen drei Einsatzszenarien ist gemeinsam, dass sie heute nur deshalb möglich sind, da sie auf zwei Basis-Technologien setzen, die erst vor rund 10 Jahren entwickelt wurden: Hadoop und NoSQL.

Bei Hadoop handelt es sich um eine Open Source Technologie zum Speichern und Verarbeiten vieler verteilter Daten unter Verwendung von Commodity Hardware, die zu Cluster zusammengeschlossen werden. NoSQL bezeichnet eine Datenbank, die nicht mehr auf das relationale Datenbank-Konzept, also verschiedene Tabellen, die miteinander durch Beziehungen verbunden sind, wie bei SQL aufsetzt, sondern andere Ansätze verfolgen. Dabei gibt es gleich neun verschiedene Typen von NoSQL-Datenbanken, die jeweils nach einem anderen Konzept funktionieren. So gibt es z.B, No SQL-Datenbanken die auf dem Objektmodell (Zope DB), dem Dokumentenmodell (Lotus Notes, Clusterpoint) oder nach Key-Value-Stores (Aerospike) aufsetzen. Aber egal nach welchem Konzept die NoSQL-Datenbanken arbeiten, gemeinsam ist Ihnen allen, dass sie über einfachere Mechanismen (Algorithmen) zur Verarbeitung hoher Datenmengen verfügen, die mit dem relationalen Ansatz nicht mehr aufgefangen werden könnten.

Im zweiten Teil dieses Blog-Artikels beschäftigen wir uns noch detaillierter mit den beiden wichtigsten Big Data Technologien. Also bleiben Sie dran…

Bildquelle: Yoyo  / pixelio.de