Aus dem Unterricht des CAS Disruptive Technologies mit Harro M. Wiersma berichtet Roland Gubler:

Big Data ist eines der Schlagwörter des Digitalisierungszeitalters. Es befasst sich mit zwei wesentlichen Aspekten: Die immer schneller wachsenden Datenmengen und die  IT Innovationen, die uns ermöglichen, diese Daten bedeutend zu analysieren.

In den frühen 90-er Jahren haben Unternehmen mittels Business-Intelligence-Systemen (BI) oder Business-Warehouse-Systemen (DWH) begonnen, strukturierte Daten auszuwerten um zum Beispiel exakte Tages-, Wochen- oder Monats Auswertungen zu generieren. Die Nutzung von Apps, Mobile Geräten, Tracking Systemen, RFID Tags, Sensor-Netzwerken, Sozialen Netzwerken, Internetsuche, E-Commerce und Video Archiven – um nur einige Quellen zu nennen – generiert heutzutage gigantische und meist unstrukturierte Datenmengen, welche von herkömmlichen Datenbanken oder BI/DWH Systemen nicht mehr gespeichert respektive analysiert werden können.

Aufgrund der riesigen Datenmengen ist Big Data schwierig zu erfassen, zu speichern, zu analysieren, zu teilen und zu visualisieren.

Informationen, welche aus diesen Daten gewonnen werden, generieren einen Mehrwert für Unternehmungen und begünstigen dadurch die rasante Weiterentwicklung von IT Technologien. Dies hat wiederum zur Folge, dass Technologien, welche diese Daten erzeugen, speichern und auswerten stets billiger, schneller, technisch ausgereifter und einfacher zu bedienen werden.

„Wenn das Produkt gratis ist, ist der Nutzer das Produkt“.

Werden Daten von Analysten kontextrelevant verknüpft oder mit zusätzlichen Daten angereichert, können daraus aussagekräftige Nutzerprofile oder Markttrends abgeleitet werden – „The behavior of patterns”. So werden beispielsweise Menschenansammlungen und deren Bewegungsmuster durch Mobile-Signale analysiert um die Einsatzplanung von Sanität und Polizei zu optimieren. Durch Bewegungs-Tracking die Wege eines Kunden im Laden aufgezeichnet um die Produkte optimal zu platzieren. Auf Radwegen elektromagnetische Signale ausgewertet um die Verkehrsrouten der Nutzer zu verstehen. Wird ein Produkt mit einem RFID Tag über seinen Lebenszyklus verfolgt, können Aussagen getroffen werden, wo und wie lange es im Einsatz war bevor es in der Verbrennungsanlage entsorgt wurde (Bsp. Gillette Rasierer).

Entscheidungen werden heute auf Grund von Daten getroffen

Big Data hat durch seine diversen Anwendungs- und Analysemöglichkeiten das gesellschaftliche Verhalten vom produktorientierten Denken zum datenorientierten Denken wesentlich beeinflusst. Entscheidungen werden heute auf Grund von Daten getroffen. Das Produkt selber verliert an Wert. Entscheidend ist, welche Daten ein Produkt erzeugt oder welche Daten man damit auswerten kann. Anders gesagt: Was wäre der Wert eines Mobilen Endgerätes, wenn ein Individuum nicht auf Apps zugreifen könnte die für seine Bedürfnisse einen zusätzlichen Mehrwert erschließen?

Welche Technologietreiber haben unser gesellschaftliches Verhalten beeinflusst?

Access:
  • Einfacherer Zugriff auf grosse Datenquellen
Hardware:
  • Kosten um Daten zu speichern respektive darauf zuzugreifen werden immer geringer.
Dashboards:
  • Grosse Datenquellen können immer benutzerfreundlicher dargestellt und über dynamische Dashboards analysiert werden. FB, Twitter, Uber, AirBnB, Tripadvisor, Booking.com, etc.

Wer hat unsere Daten?

Wir haben uns Gedanken gemacht, „Welche Organisation“ von uns „Welche Daten“ besitzen – hier eine sicherlich keine abschliessende Übersicht:

Welche Organisationen halten von uns persönliche Daten? Welche Daten besitzen Sie?
Arbeitgeber Personaldaten, familiäre Situation
Regierung und Behörden Einkommen, Vermögen, familiäre Situation
Krankenkassen Gesundheitsdaten
Ärzte und Spitäler Krankheitsverläufe
Telco-Anbieter Bewegungsdaten, evtl. Internetdaten
Versicherungsgesellschaften Vermögensverhältnisse, Wohnsituation
Kredit Karten Firmen Sämtliche Transaktionen und Konsumverhalten
Kundenkarten, Migros, Coop Warenkorb, Konsumverhalten,
Banken / Internet Banking Transaktionen, Einkommen, Besitzverhältnisse
Google / Facebook / Twitter Suchverhalten, Sozialverhalten, Pers. Interessen, etc.
SBB, Swiss Pass, ZVV Tickets: Wann / wie / wohin gereist. Reiseroute, Online
Fluggesellschaften Sämtlich Flugdaten, Bonus-Programme
Online-Versandhändler Kaufverhalte, Potential, Alter, Style Präferenzen
Reiseportale, Hotels Reiseverhalten, Länder, Regionen, Pers. Interessen
Energie-Provider Energieverbrauch, Wasserverbrauch, etc.
Autohersteller / Autogaragen Fahrverhalten, Serviceverhalten, Kaufverhalten
Apple Kreditkartentransaktionen, Cloud-Inhalte, Apps, etc.
Amazone, Netflix, Spotify Seh- und Hörgewohnheiten

Welche Technologien ermöglichen es, alle diese Daten zu sammeln?

Web Browser und Search Engines
  • Microsoft Internet Explorer, Apple Safari,
  • Google, Bing, Yahoo
Smartphones / Tablet Computers und Apps
  • iPhone, iPad, Kindle, Samsung Galaxy
  • Ticket- und Restaurant Reservierungen
  • Tripadvisor, booking.com, MedWatcher
Spital- und Medizin Systeme
  • Hospital Information System
  • Laboratories, Imaging Centers, Blut Datenbanken
  • Geburt- und Todesregister
Bank Systeme
  • Bankomabezüge und Internetbanking
  • Call Centre
  • Relationship Managment und CRM Systeme
Internet Service Provider
  • Swisscom, Sunrise, Salt, upc cablecom,
Kredit Karten Firmen
  • Master Card, Visa, Amex, Maestro
Consumer Product Companies
  • Kundenkarten, Migros, Coop, Ikea,
Games Boxes und GPS Systeme
  • XBOX, PlayStation,
  • GPS Systeme, Google Earth
Regierung und Behörden
  • Steuerbehörden, Gemeindeverwaltungen, AHV
Movie Rental Sites
  • Netflix, Amazon, Redbox
HDTV mit Internetverbindung
  • TV Hersteller und TV Programm Provider

Gemäss Schätzungen verdoppelt sich das Volumen von gesammelten Business Daten alle 1,2 Jahre. Es wird jedoch davon ausgegangen, dass lediglich 0,5% aller gesammelten Daten auch analysiert werden. Ein Grossteil der Daten wird aussortiert da er keinen Wert für potentielle Analysen darstellt. Er wird als „White Noise“ bezeichnet.

Wie könnten wir uns gegen die Weitergabe oder Anreicherung unserer persönlichen Daten schützen? Eine Ideensammlung:

   pic-2  

Big Data zu vermeiden oder sich aktiv davor zu schützen scheint unrealistisch und in der heutigen Welt nicht praktikabel. Harro M. Wiersma hat uns dennoch ein paar nicht ganz ernstzunehmende Tipps auf den Weg gegeben:

  • Bezahlen Sie alles in bar
  • Gehen Sie nie Online
  • Benutzen Sie kein Telefon – weder Handy noch Festnetz
  • Benutzen Sie keine Kundenkarten
  • Gehen Sie nicht zum Arzt und lassen Sie sich keine Rezepte ausstellen
  • Gehen Sie nicht aus dem Haus!

Big Data – der theoretische Ansatz

Mögliche Definition für Big Data:

Big Data ist eine Kategorie von Technologien, Applikationen und Prozessen, welche es ermöglicht, große Datenmengen zu erfassen, zu speichern, zu analysieren und darauf zuzugreifen. Die Perspektiven von Big Data liegen jedoch deutlich über den Möglichkeiten heutiger Business-Intelligence-Systeme (BI).

Was sind die Wegbereiter für Big Data?    

1. Business Intelligence – Evolution

BI/DWH Lösungen haben sich über die letzten 20 Jahren auf einer stabilen Architektur kontinuierlich weiterentwickelt.

2. Hardware – Revolution

Prozessoren, Speicher und Netzwerke Bandbreiten haben sich in den letzten Jahren exponentiell weiterentwickelt. Während sich der Dynamic RAM Price (Bits per Dollar at Production) alle 1.5 Jahre verdoppelt, halbiert sich der Durchschnittspreis eines Transistors seit 1970 alle 1.6 Jahre.

3. Software – New Generation of SW Solutions

Um das volle Potential der heutigen Hardware nutzen zu können, werden die Entwicklungssprachen kontinuierlich verbessert.

Was macht Big Data erfolgreich – die 5V des Big Data:

Die kritischen Erfolgsfaktoren von Big Data beziehen sich auf die 3 Dimensionen Volume, Velocity, und Variety und wird durch die Einflussgrößen Value und Veracity erweitert.

1. Volume

  • Der Umfang respektive das Datenvolumen welches verarbeitet wird
  • Entwicklung: Von Gigabyte & Terabyte zu Petabyte & Exabyte
2. Velocity

  • Die Geschwindigkeit mit der die Datenmenge generiert und transferiert wird
  • Entwicklung: Von Stunden & Minuten zu Sekunden & Millisekunden
3. Variety

  • Die Bandbreite der Datentypen und Quellen die verarbeitet werden können
  • Entwicklung: Von strukturierten Daten zu teil- od. unstrukturierten Daten
4. Value

  • Der unternehmerische Mehrwert der aus den Daten entsteht
  • Aus Daten werden Informationen. Informationen generieren Mehrwert
5 Veracity

  • Die Wahrhaftigkeit der Daten und Sicherstellung der Datenqualität
  • Glaubwürdigkeit und Aktualität der Daten

 Anwendungsbeispiele von Big Data in verschiedenen Industriebereichen


pic-3

Die 6 Phasen eines Big Data Projektes

Wie kann man aus unübersichtlichen Datenmengen wertvolle Informationen ableiten? Oder: „We don’t know what we could already know…“

Viele Big Data Projekte sind zum Scheitern verurteilt, da bereits zu Beginn das Projektziel nicht klar formuliert wird. „Was“ soll genau „Wozu“ ermittelt werden?
Die Zielerreichung – und somit der Mehrwert – muss klar über Use Cases definiert und unverkennbar sein.

Der Grundsatz „Think big start small“ hat sich in Big Data Projekten bewährt. Es hat sich gezeigt, dass bereits mit bescheidenen Mitteln aussagekräftige Ergebnisse erzielt werden können. Die dazu benötigte Technologie ist Mittel zum Zweck.

pic-4

Phase 1 – Requirement Analysis:
– Definition der Zielerreichung anhand von Use Cases.
– Was ist die Problemstellung? Was soll genau ermittelt werden?
– Welchen Mehrwert versprechen wir uns davon?

Phase 2 – Data Collection:
– Welche Daten bereits in welcher Form vorhanden.
– Welche Daten müssen zusätzlich noch erhoben werden.

Phase 3 – Data Integration:
– Die Verarbeitung der Daten (einbinden und verknüpfen
– Anreichern von Daten aus unterschiedlichen Quellen.
– Die Datenintegration ist oft die grösste Herausforderung.

Phase 4 – Model Building
– Anwendung des bestmöglichen Daten Modells
– Evaluierung des kompletten Algorithmus

 Phase 5 – Testing:
– Detaillierte und strukturierte Testabläufe.
– Testen des Algorithmus. Bei Bedarf zurück zu Phase 4.

 Phase 6 – Implementing:
– Projekt Implementierung und Lesson Learned


Gruppenarbeit – „Hospital Case“

Aufgabenstellung:

  • Acht Spitäler bieten diverse Behandlungen an. Keiner der Spitäler ist gross genug und hat nicht die kritische Masse um sich auf ein Spezialgebiet zu fokussieren.
  • Wie können die acht Spitäler mittels Big Data ihre Zusammenarbeit optimieren?

Ergebnis der Gruppenarbeiten:
gruppe-1_hospital-case gruppe-2_hospital-case gruppe-3_hospital-case

gruppe-4_hospital-case


Conclusions & Wrap Up

  • Big Data erfordert einen Umdenkungsprozess auf Seite IT und Business.
  • Die Kooperation von Big Data und Analytics kann signifikanten Mehrwert durch aufbereitete Informationen
  • Business Analytics verschafft einen kompetitiven Vorteil indem es erlaubt Kundengruppen in hohem Detailierungsgrad zu segmentieren. Dies ermöglicht auf das Kundenbedürfnis massgeschneiderte Produkte und Services anzubieten.
  • Raffinierte Analysen können massgeblich die Entscheidungsfindung beeinflussen, Risiken minimieren und Erkenntnisse aufzeigen, welche zuvor nicht ersichtlich waren.
  • Big Data beinhaltet das Potential zukünftige Generationen von Produkten und Services zu entwickeln