Big Data

Big DataAls Big Data bezeichnet man Datenmengen mit den drei „V“ als besonderen Merkmalen:

  • Volume: Große Datenmengen
  • Variety: Unterschiedliche, häufig unstrukturierte Datenformate aus unterschiedlichen Quellen
  • Velocity: Enge Zeitanforderungen für die Auswertung der Daten.

Ungenutzte Daten

Big-Data-Analysen basieren häufig auf Quellen, wie Social-Media und Daten von Mobilen Anwendungen. Aber auch im eigenen Haus liegen Datenschätze, die sich lediglich mit konventionellen Techniken bisher nicht heben ließen.

Ein Beispiel sind Informationen zu Zahlungsvorgängen, die konventionell zwar saldiert werden, deren Auswertung – etwa im Hinblick auf typische Betrugsmuster – die Möglichkeiten der Datenbankserver aber übersteigen würde. Protokolldateien fallen in jedem Unternehmen in so großer Menge an, dass sie gerade deswegen nur in Ausnahmefällen (post mortem) genutzt werden.

Externe Daten z.B. aus Sozialen Netzwerken lassen Rückschlüsse auf Kundenvorlieben zu. Videos und Blogeinträge enthalten Bewertungen zu Produkten – eigenen und denen des Mitbewerbs. Die Beobachtung von Unternehmenswebseiten kann Rückschlüsse auf das Wachstum, zukünftige Investitionen oder auf Probleme liefern.

Unstrukturierte Daten nutzbar machen

Die oben genannten Beispiele zeigen schon die Vielfalt der Datenformate. Häufig lässt sich kaum von einem Format sprechen - etwa bei Texten oder gar Video-/Audiodateien. Hier erfolgt eine Aufbereitung, die relevante und auswertbare Informationen aus den unstrukturierten Daten extrahiert.

Auch die aufbereiteten Daten lassen sich jedoch nicht wie eine relationale Datenbank auswerten. Eine Abbildung der Daten auf eine relationale Struktur würde bereits ein weitgehendes Verständnis voraussetzen, das aber erst durch die Auswertung gewonnen werden kann.

Zur Analyse der Daten werden daher Methoden der induktiven Statistik und der Mustererkennung herangezogen. Welche Informationen sich aus den Daten gewinnen lassen, welche Muster plausibel erscheinen und welche Verfeinerungen eventuell noch bei der Aufbereitung notwendig sind, kann nur ein fachkundiger Benutzer in enger Interaktion mit dem System entscheiden.

Neue Rollen von Fachabteilung und IT

Big-Data macht eine veränderte Zusammenarbeit von Fachabteilung und IT notwendig. Anders als bei klassischen Reports steht nicht die exakte Definition von Reports und der centgenaue Abgleich im Vordergrund. Vielmehr muss die Fachabteilung die Möglichkeit zur explorativen Analyse der Daten unter verschiedenen Gesichtspunkten haben. Neue Datenquellen müssen zügig angeschlossen werden können.

Der regelmäßige Report, die Umsatzstatistik aus der klassischen Datenbank wird weiter ihren Platz behalten - aber sie wird ergänzt werden z.B. durch eine exaktere Kundenansprache, die genau auf die Bedürfnisse des Kunden eingeht und die auf Big-Data-Analysen beruht.

Software Innovation Campus

Als Mitglied der Initiative Software Innovation Campus Paderborn treibt S&N das Thema Big-Data in der entsprechenden Arbeitsgruppe voran.

Ansprechpartner: Dr. Klaus Schröder; Turn on Javascript!