Big Data – from Data to added Value

Aus dem Unterricht des CAS Disruptive Technologies mit Harro M. Wiersma berichtet Roland Gubler:
Big Data ist eines der Schlagwörter des Digitalisierungszeitalters. Es befasst sich mit zwei wesentlichen Aspekten: Die immer schneller wachsenden Datenmengen und die IT Innovationen, die uns ermöglichen, diese Daten bedeutend zu analysieren.
In den frühen 90-er Jahren haben Unternehmen mittels Business-Intelligence-Systemen (BI) oder Business-Warehouse-Systemen (DWH) begonnen, strukturierte Daten auszuwerten um zum Beispiel exakte Tages-, Wochen- oder Monats Auswertungen zu generieren. Die Nutzung von Apps, Mobile Geräten, Tracking Systemen, RFID Tags, Sensor-Netzwerken, Sozialen Netzwerken, Internetsuche, E-Commerce und Video Archiven – um nur einige Quellen zu nennen – generiert heutzutage gigantische und meist unstrukturierte Datenmengen, welche von herkömmlichen Datenbanken oder BI/DWH Systemen nicht mehr gespeichert respektive analysiert werden können.
Aufgrund der riesigen Datenmengen ist Big Data schwierig zu erfassen, zu speichern, zu analysieren, zu teilen und zu visualisieren.
Informationen, welche aus diesen Daten gewonnen werden, generieren einen Mehrwert für Unternehmungen und begünstigen dadurch die rasante Weiterentwicklung von IT Technologien. Dies hat wiederum zur Folge, dass Technologien, welche diese Daten erzeugen, speichern und auswerten stets billiger, schneller, technisch ausgereifter und einfacher zu bedienen werden.
„Wenn das Produkt gratis ist, ist der Nutzer das Produkt“.
Werden Daten von Analysten kontextrelevant verknüpft oder mit zusätzlichen Daten angereichert, können daraus aussagekräftige Nutzerprofile oder Markttrends abgeleitet werden – „The behavior of patterns”. So werden beispielsweise Menschenansammlungen und deren Bewegungsmuster durch Mobile-Signale analysiert um die Einsatzplanung von Sanität und Polizei zu optimieren. Durch Bewegungs-Tracking die Wege eines Kunden im Laden aufgezeichnet um die Produkte optimal zu platzieren. Auf Radwegen elektromagnetische Signale ausgewertet um die Verkehrsrouten der Nutzer zu verstehen. Wird ein Produkt mit einem RFID Tag über seinen Lebenszyklus verfolgt, können Aussagen getroffen werden, wo und wie lange es im Einsatz war bevor es in der Verbrennungsanlage entsorgt wurde (Bsp. Gillette Rasierer).
Entscheidungen werden heute auf Grund von Daten getroffen
Big Data hat durch seine diversen Anwendungs- und Analysemöglichkeiten das gesellschaftliche Verhalten vom produktorientierten Denken zum datenorientierten Denken wesentlich beeinflusst. Entscheidungen werden heute auf Grund von Daten getroffen. Das Produkt selber verliert an Wert. Entscheidend ist, welche Daten ein Produkt erzeugt oder welche Daten man damit auswerten kann. Anders gesagt: Was wäre der Wert eines Mobilen Endgerätes, wenn ein Individuum nicht auf Apps zugreifen könnte die für seine Bedürfnisse einen zusätzlichen Mehrwert erschließen?
Welche Technologietreiber haben unser gesellschaftliches Verhalten beeinflusst?
Access: |
|
Hardware: |
|
Dashboards: |
|
Wer hat unsere Daten?
Wir haben uns Gedanken gemacht, „Welche Organisation“ von uns „Welche Daten“ besitzen – hier eine sicherlich keine abschliessende Übersicht:
Welche Organisationen halten von uns persönliche Daten? | Welche Daten besitzen Sie? |
Arbeitgeber | Personaldaten, familiäre Situation |
Regierung und Behörden | Einkommen, Vermögen, familiäre Situation |
Krankenkassen | Gesundheitsdaten |
Ärzte und Spitäler | Krankheitsverläufe |
Telco-Anbieter | Bewegungsdaten, evtl. Internetdaten |
Versicherungsgesellschaften | Vermögensverhältnisse, Wohnsituation |
Kredit Karten Firmen | Sämtliche Transaktionen und Konsumverhalten |
Kundenkarten, Migros, Coop | Warenkorb, Konsumverhalten, |
Banken / Internet Banking | Transaktionen, Einkommen, Besitzverhältnisse |
Google / Facebook / Twitter | Suchverhalten, Sozialverhalten, Pers. Interessen, etc. |
SBB, Swiss Pass, ZVV | Tickets: Wann / wie / wohin gereist. Reiseroute, Online |
Fluggesellschaften | Sämtlich Flugdaten, Bonus-Programme |
Online-Versandhändler | Kaufverhalte, Potential, Alter, Style Präferenzen |
Reiseportale, Hotels | Reiseverhalten, Länder, Regionen, Pers. Interessen |
Energie-Provider | Energieverbrauch, Wasserverbrauch, etc. |
Autohersteller / Autogaragen | Fahrverhalten, Serviceverhalten, Kaufverhalten |
Apple | Kreditkartentransaktionen, Cloud-Inhalte, Apps, etc. |
Amazone, Netflix, Spotify | Seh- und Hörgewohnheiten |
Welche Technologien ermöglichen es, alle diese Daten zu sammeln?
Web Browser und Search Engines |
|
Smartphones / Tablet Computers und Apps |
|
Spital- und Medizin Systeme |
|
Bank Systeme |
|
Internet Service Provider |
|
Kredit Karten Firmen |
|
Consumer Product Companies |
|
Games Boxes und GPS Systeme |
|
Regierung und Behörden |
|
Movie Rental Sites |
|
HDTV mit Internetverbindung |
|
Gemäss Schätzungen verdoppelt sich das Volumen von gesammelten Business Daten alle 1,2 Jahre. Es wird jedoch davon ausgegangen, dass lediglich 0,5% aller gesammelten Daten auch analysiert werden. Ein Grossteil der Daten wird aussortiert da er keinen Wert für potentielle Analysen darstellt. Er wird als „White Noise“ bezeichnet.
Wie könnten wir uns gegen die Weitergabe oder Anreicherung unserer persönlichen Daten schützen? Eine Ideensammlung:
![]() |
Big Data zu vermeiden oder sich aktiv davor zu schützen scheint unrealistisch und in der heutigen Welt nicht praktikabel. Harro M. Wiersma hat uns dennoch ein paar nicht ganz ernstzunehmende Tipps auf den Weg gegeben:
- Bezahlen Sie alles in bar
- Gehen Sie nie Online
- Benutzen Sie kein Telefon – weder Handy noch Festnetz
- Benutzen Sie keine Kundenkarten
- Gehen Sie nicht zum Arzt und lassen Sie sich keine Rezepte ausstellen
- Gehen Sie nicht aus dem Haus!
Big Data – der theoretische Ansatz
Mögliche Definition für Big Data:
Big Data ist eine Kategorie von Technologien, Applikationen und Prozessen, welche es ermöglicht, große Datenmengen zu erfassen, zu speichern, zu analysieren und darauf zuzugreifen. Die Perspektiven von Big Data liegen jedoch deutlich über den Möglichkeiten heutiger Business-Intelligence-Systeme (BI).
Was sind die Wegbereiter für Big Data?
1. | Business Intelligence – Evolution
BI/DWH Lösungen haben sich über die letzten 20 Jahren auf einer stabilen Architektur kontinuierlich weiterentwickelt. |
2. | Hardware – Revolution
Prozessoren, Speicher und Netzwerke Bandbreiten haben sich in den letzten Jahren exponentiell weiterentwickelt. Während sich der Dynamic RAM Price (Bits per Dollar at Production) alle 1.5 Jahre verdoppelt, halbiert sich der Durchschnittspreis eines Transistors seit 1970 alle 1.6 Jahre. |
3. | Software – New Generation of SW Solutions
Um das volle Potential der heutigen Hardware nutzen zu können, werden die Entwicklungssprachen kontinuierlich verbessert. |
Was macht Big Data erfolgreich – die 5V des Big Data:
Die kritischen Erfolgsfaktoren von Big Data beziehen sich auf die 3 Dimensionen Volume, Velocity, und Variety und wird durch die Einflussgrößen Value und Veracity erweitert.
1. | Volume
|
2. | Velocity
|
3. | Variety
|
4. | Value
|
5 | Veracity
|
Anwendungsbeispiele von Big Data in verschiedenen Industriebereichen
Die 6 Phasen eines Big Data Projektes
Wie kann man aus unübersichtlichen Datenmengen wertvolle Informationen ableiten? Oder: „We don’t know what we could already know…“
Viele Big Data Projekte sind zum Scheitern verurteilt, da bereits zu Beginn das Projektziel nicht klar formuliert wird. „Was“ soll genau „Wozu“ ermittelt werden?
Die Zielerreichung – und somit der Mehrwert – muss klar über Use Cases definiert und unverkennbar sein.
Der Grundsatz „Think big start small“ hat sich in Big Data Projekten bewährt. Es hat sich gezeigt, dass bereits mit bescheidenen Mitteln aussagekräftige Ergebnisse erzielt werden können. Die dazu benötigte Technologie ist Mittel zum Zweck.
Phase 1 – Requirement Analysis:
– Definition der Zielerreichung anhand von Use Cases.
– Was ist die Problemstellung? Was soll genau ermittelt werden?
– Welchen Mehrwert versprechen wir uns davon?
Phase 2 – Data Collection:
– Welche Daten bereits in welcher Form vorhanden.
– Welche Daten müssen zusätzlich noch erhoben werden.
Phase 3 – Data Integration:
– Die Verarbeitung der Daten (einbinden und verknüpfen
– Anreichern von Daten aus unterschiedlichen Quellen.
– Die Datenintegration ist oft die grösste Herausforderung.
Phase 4 – Model Building
– Anwendung des bestmöglichen Daten Modells
– Evaluierung des kompletten Algorithmus
Phase 5 – Testing:
– Detaillierte und strukturierte Testabläufe.
– Testen des Algorithmus. Bei Bedarf zurück zu Phase 4.
Phase 6 – Implementing:
– Projekt Implementierung und Lesson Learned
Gruppenarbeit – „Hospital Case“
Aufgabenstellung:
- Acht Spitäler bieten diverse Behandlungen an. Keiner der Spitäler ist gross genug und hat nicht die kritische Masse um sich auf ein Spezialgebiet zu fokussieren.
- Wie können die acht Spitäler mittels Big Data ihre Zusammenarbeit optimieren?
Ergebnis der Gruppenarbeiten:
gruppe-1_hospital-case gruppe-2_hospital-case gruppe-3_hospital-case
Conclusions & Wrap Up
- Big Data erfordert einen Umdenkungsprozess auf Seite IT und Business.
- Die Kooperation von Big Data und Analytics kann signifikanten Mehrwert durch aufbereitete Informationen
- Business Analytics verschafft einen kompetitiven Vorteil indem es erlaubt Kundengruppen in hohem Detailierungsgrad zu segmentieren. Dies ermöglicht auf das Kundenbedürfnis massgeschneiderte Produkte und Services anzubieten.
- Raffinierte Analysen können massgeblich die Entscheidungsfindung beeinflussen, Risiken minimieren und Erkenntnisse aufzeigen, welche zuvor nicht ersichtlich waren.
- Big Data beinhaltet das Potential zukünftige Generationen von Produkten und Services zu entwickeln