Aus dem Unterricht des CAS Disruptive Technologies mit Harro M. Wiersma berichtet Adrian Eicher.

Grundsätzlich ist “Big Data” gleich wie Business Intelligence (BI) aus den 90iger Jahren. Wir können es heute einfach schneller und schöner da die Rechenpower grösser ist und sich die grafischen Gestaltungsmöglichkeiten vereinfacht haben. Heisst das, “Alter Wein in neuen Schläuchen?”

Von Daten zu Informationen.

Big Data im Kontext einer Unternehmung darf nicht als eigenständiges Thema betrachtet werden. Vielmehr ist die Integration in die bestehenden Geschäftsprozesse wichtig. Big Data ist ein “Change of Mindset” an die IT aber auch an die Fachseite. Wenn man es richtig macht, kann man einen wirklichen Mehrwert genieren. Man könnte jetzt sagen: “Daten sind das neue Gold”. Aber Vorsicht, die Analogie zum Gold ist, man weiss dass es da ist, aber es zu finden und zu fördern ist die grosse Arbeit. Das ist gleich bei einem Big Data Projekt. Dazu kommt die Herausforderung Datenstränge zu verknüpfen und übereinander zu legen um sie danach auch richtig interpretieren zu können. Auch heute ist es noch so, dass sehr viele Firmen darüber sprechen aber immer noch nichts konkretes mit ihren Daten machen.

Übrigens, Gartner hat das Thema “Big Data” aus dem Hype Cycle genommen. Da es sich bei Big Data nicht um eine aufkommende Technologie handelt.

Harro M. Wiersma stellt uns die 3 Arten von Big Data vor und gibt uns jeweils entsprechende Beispiele.

1. Business Intelligence (strukturierte Daten)

Es handelt sich dabei um Daten, die in einer Struktur organisiert sind, damit man sie identifizieren kann. Die universellste Form an strukturierten Daten ist zum Beispiel eine SQL- oder Access-Datenbank. Das klassische analysieren und strukturieren von Daten auf relationalen Datenbanken. Das kennen wir bereits seit den 90iger Jahren.

2. Content Intelligence (unstrukturierte Daten)

Die Content Intelligence Technologie wurde von Google, Yahoo und Facebook für den eigenen Gebrauch entwickelt. Im Gegensatz zu Business Intelligence haben unstrukturierte Daten keine identifizierbare Struktur. Unstrukturierte Daten bestehen in der Regel aus Bildern, Objekten, Text und anderen Datentypen, die nicht Teil einer Datenbank sind. Die meisten Unternehmensdaten gelten heutzutage als unstrukturiert.

E-Mails sieht man als unstrukturierte Daten an – die Nachrichten selbst sind allerdings in einer Datenbank Exchange oder Lotus Notes organisiert. Der Body einer E-Mail ist aber ein formfreier Text ohne jegliche Struktur. Die Daten sind roh. Bei Dokumenten handelt es sich ebenfalls um unstrukturierte Daten. Obwohl Word-Dokumente natürlich eine Formatierung haben, ist der Inhalt beliebig.

Harro gibt uns das Beispiel Hadoop an; Hadoop ist ein Open-Source-Java-basiertes Programmier-Framework, das die Verarbeitung und Speicherung von extrem großen Datensätzen in einer verteilten Computerumgebung unterstützt. Hadoop macht es möglich, Anwendungen auf Systemen mit Tausenden von Waren-Hardwareknoten auszuführen und Tausende von Terabyte Daten zu verarbeiten.

3. Real Time Intelligence (Data Streams)

Real-time Business Intelligence (RTBI ) ist ein Konzept, das den Prozess der Bereitstellung von Business Intellligence (BI) oder Informationen über die Geschäftsabläufe beschreibt, wie sie auftreten. Echtzeit bedeutet, dass der Zugang zu Informationen jederzeit wenn erforderlich möglich ist. z.B. Datenströme Nutzen oder eine Transaktion von Bankdaten.

Opendata

Die Schweiz bietet sehr viele Daten als Open Data öffentlich an. Opendata.swiss ist das Portal für Schweizer Open Government Data (OGD). Hier bekommt der Nutzer Zugriff auf eine Vielzahl von öffentlichen Daten, welche in verschiedene Kategorien unterteilt sind. Ein Besuch auf dieser Seite lohnt sich. Das herunterladen der Behördendaten ist kostenlos.

Big Data im Retail

Das das Thema Big Data auch bei Gebrauchsgegenständen angekommen ist, zeigt das Beispiel von Gillette. Rasierklingen von Gillette sind mit einem RFID-Tag ausgestattet um festzustellen, wie lange es geht bis eine Rasierklinge in der Entsorgungsstation kommt. Mit den gesammelten Daten erhofft sich Gillette mit dieser Analyse das Kauf- und Nutzungsverhalten seiner Kunden genauer zu kennen.

Die Herausforderung ist festzustellen, welche Daten haben einen Wert für meinen Geschäftsprozess und welche Daten sind überhaupt relevant. Harro gibt wieder ein Beispiel. Der Kleiderhersteller Polo Ralph Lauren zahlt 7 Dollar wenn die Daten zwischen Offline und Online verbunden und identifiziert werden können. Mit dieser Verknüpfung können sie personalisierte Werbung machen. Es wäre also möglich, dass wenn ich künftig in den Laden gehe, ich somit erkannt werde und z.B. eine Auswahl der meist gekauften Produkte von mir angezeigt bekomme und so von direkten Aktionen profitieren kann.

Das Marketing bei uns läuft anders als in Amerika. Dort wird geschaut welche Kundengruppe kauft normalerweise welche Produkte. Und aufgrund vom Kaufverhalten weiss der Anbieter was der Kunde kauft. Dann wird aufgrund statistischer Daten dem Konsumenten aktiv Werbung für ein neues Produkt gemacht, welches der Kunde grundsätzlich kaufen könnte. Im Hintergrund wird geschaut wieviele Produkte am Lager sind und abverkauft werden können.

Wie gehe ich ein Big Data Projekt an?

  1. Requirement Analysis: Wie gehen wir vor?
  2. Data Collection: Welche Daten möchte ich analysieren. Relevanz In- und Ausschluss?
  3. Data Integration: Was wird danach mit den Daten gemacht?
  4. Model Building: Wie soll unser System schlussendlich Daten abfertigen können?
  5. Testing: Sind die richtigen Daten erfasst worden?
  6. Implementierung: Die Daten werden in einem Dashboard implementiert und visualisiert.

In der darauffolgenden Gruppenarbeit mussten wir folgende Fragestellung diskutieren. “Welchen Schlüsselregeln sollen Organisationen im Umgang mit unseren Daten folgen?

Das Ergebnis der Gruppenarbeit sieht wie folgt aus:

  • Es darf kein Rückschluss auf das Subjekt (Person) gemacht werden können
  • Die Persönlichkeit meiner Daten muss von meinem Arbeitgeber geschützt sein
  • Ich will wissen welche Daten von mir bei einer Organisation gespeichert sind (Transparenz)
  • AGB Check
  • Ich will die Wahl haben ob meine Daten weiterverwendet werden können
  • Ich möchte einen Gegenwert für das die Daten verwendet werden können
  • Anspruch, dass die Daten gelöscht werden, wenn der Dienst nicht mehr genutzt wird.
  • Aktive Information wenn Daten gehackt werden. (Ist neu im Schweizer Datenschutzgesetz geregelt.)
  • Meine Daten dürfen nicht gegen mich verwendet werden

Fazit:

  • Big Data ist ein Umdenken für IT und Business.
  • Big Data und Business Analytics kann durch die Transparenz von Informationen einen erheblichen Wert erlangen.
  • Business Analytics ermöglicht eine immer engere Segmentierung der Kunden und damit eine wesentlich präzisere Ausrichtung der Produkte oder Dienstleistungen, was einen Wettbewerbsvorteil darstellt.
  • Durch hochentwickelte Analysen lassen sich Entscheidungsprozesse erheblich verbessern, Risiken minimieren und wertvolle Erkenntnisse freilegen, die sonst verborgen bleiben.
  • Big Data kann für die Entwicklung der nächsten Generation von Produkten und Dienstleistungen genutzt werden.

Aber auch eines ist sicher, weniger werden die Daten nicht. Das heisst, um auf den Anfang dieses Blogeintrages nochmals zurück zukommen. Alter Wein in neuen Schläuchen – nur die Schläuche sind jetzt einfach grösser und der Wein gehaltvoller, Cheers.