Aus dem Unterricht CAS Disruptive Technologies mit Dozent Dr. Simon Hefti berichtet Daniel W. Fuchs:

Massendaten, Datenwissenschaft und Algorithmen bzw. Künstliche Intelligenz verstehen ist Zweck dieses Blog’s und noch etwas die US-Wahlen 2016.

Was ist nun Data Science und Big Data?

Was sagt Simon Hefti (2019) im Kurzinterview zu Datenwissenschaft (Data Science) und Massendaten (Big Data)? „Big Data ist ein Marketing Name. Besser wäre es für das ganze Thema zu sagen: „A set of methods and tools used for data-driven value creation.“, OK, einfach oder?

Wie werden Big Data erzeugt? Wann helfen wir mit, diese zu erzeugen? Immer, wenn wir clicken, liken, surfen, kaufen, bewerten. Es gibt Schätzungen, dass weniger als 10 % aller gesammelten Daten wirklich später nutzbringend analysiert und aufbereitet werden. Daten sammeln wird sich in Zukunft weiter exponentiell ausdehnen, weil vermehrt überall gesammelt werden kann. Bill Gate’s dream: A computer in every home. Ist zumindest in der ersten Welt Wirklichkeit. Doch es geht weiter, jede Person hat Zugriff via Tablett oder Smartphone. In Zukunft jedes Gerät mit Internet of Things. Datensammler überall.

Daten klug organisieren

Daten sind zu Beginn meist unstrukturiert und benötigen eine sinnvolle Struktur.

Beispiel eines Songs (Hefti 2019)

Spotify kann zum Beispiel via API (Application Programming Interface) bis zu 20 verschiedene Attribute zu einem Song erfassen und auslesen. Das heisst: ist der gewünschte Song tanzbar, oder macht er eher traurig’ Damit lassen sich interessante Analysen erstellen. Werber kann damit einen geeigneten Werbesong für ein neues Produkt finden.

Praktische Umsetzung: Health Insurance Data Universe

Ein weiterer Ansatz zur systematischen Datenanalyse ist von John R. Boyd (1995). Er beschreibt in seinem Buch „The Essence of Winning and Losing“ wie dies in einem Geschäftsprozess geht, siehe Abbildung „Orient – Decide – Act –Observe“ Ansatz.

Orient-Decide-Act-Observe Ansatz (Hefti 2019)

Observe: Es ist entscheidend sich einen Überblick über den Fall zu beschaffen. Konkret sind in diesem Beispiel die Mehrheit der Anfragen von Kunden einfacher Art und routinemässig zu beantworten. Am Ende konnten davon 45  % Automatisiert werden.

Orient: Aus dem Überblick gilt es im weiteren Schritt sich eine geeignete Orientierung für die Entscheidungsfindung zu verschaffen. Wie kann die kann die Reaktionszeit signifikant beschleunigt werden? Wie können Kosten reduziert werden und der Service verbessert werden?

Das Datenvolumen in diesem Fall beinhaltet: 3 Mio Kunden bzw. 30 Mio claims / Jahr, 400 claims processors und Umsetzung mit Automation mit Regeln.

Act: Die Umsetzung bedingt die gewählten Schritte in die Praxis zu führen und die definierten Verbesserungen zu erreichen. Im Beispiel Health Insurance Data Universe durch Automatisierung Fehler abzubauen und die Effizienz zu erhöhen. Dadurch lassen sich mittelfristig Kosten einsparen. Mit zwei Skalierungsproblemen ist aber zu rechnen: Kann ich das Volumen wirklich bewältigen? Und die zweite Problematik: Kann ich das Volumen schnell genug bewältigen – Zeitskala. Lean Management kann ich zusätzlich Hilfestellung leisten mit Kontinuierlichem Verbesserungsprozess (KVP), siehe www.mt.com/lean-lab). Wer mehr über Trends im Health Care Bereich wissen will: The most importent current trends for Health Care.

In welchem Kontext steht nun Data Science / Big Data zu Machine Learning und AI?

Eine Unmenge von Daten gibt noch keine Aussage für mögliche Rückschlüsse von Kundenverhalten. Diese müssen strukturiert und aufbereitet werden – analysiert. Dies bezieht sich auf technologischen Hilfsmitteln wie AI, Machine Learning und Deep Learning. Dabei geht es immer um Data, Features und Algorithmus. Das Zusammenspiel der Daten (Data), Funktionen (Features) und den Regeln (Algorithmus) kann helfen die Vorgehensweise auszuwählen bezgl. den Werkzeugen (Tools).

Data: Rohmaterial / Rohdaten

    • Geht es um problematische eMails, oder Spam-Erkennung oder eher um historische Preise für die Vorhersage der Preisentwicklung?

Features: Ausgewählte Daten oder abgeleitete Daten

    • Ist das Geschlecht entscheidend oder eher eine Leistung (des Fahrzeuges) bzw. die Anzahl Tage seit letztem Kontakt?

Algorithms: Die mathematischen und statistischen Methoden zum Erkennen und Nutzen von Mustern (Pattern)

4 Schritte für eine erfolgreiche Umsetzung in der Praxis

Für eine erfolgreiche Umsetzung empfiehlt sich auch bei Data Science / Big Data eine sinnvolle Struktur. Dabei sollte auf keinen Fall die drei ersten Themen unterschätzt werden. Dahinter verstecken sich: Sinn, Zweck und Aufgabe der Data Science. Die Technologie ist eher Mittel zum Zweck.

  1. Value Impact: Gründe, wenn es meist nicht klappt sind oft (Hefti 2019):
    • Datenprojekte bleiben meist liegen. Begründungen sind: Unser Geschäft funktioniert – kein Grund für Änderungen, Was mache ich nachher, wenn das eingeführt ist?, Wow – das ist ja richtig anstrengend! Die Sache nur halb machen (z.B. nur Finance, nur aggregiert). Start mit Technologie, statt die Hausaufgaben zu machen und über Organisation, Auswirkungen (Value Impact) und den Daten an sich zu reden. Over-Engineering (z.B. Bitemporalität) bzw. klar machen das ganze ist kein Gurus.
  1. Organisation / Culture
    • In welchem Reifegrad ist das Unternehmen? Ist sie in der Lage ein solches Projekt zu Verstehen und umsetzen? Oder soll sie sich externe Hilfe holen? Gibt es eine Data Governance? Ist darin auch ein Datenmodell, Regelungen für den Zugriff und die Datenqualität enthalten? Wie steht es mit Entscheidungsfindung, Priorisierung, und der Kontrolle?
  1. Data, 6C Modell
    • Clean, Consistent, Correct, Current, Collaborative und Compliant.
    • Die Amerikanische FDA, sowie der Europöische Leitfaden für stark regulierte Branchen entwickelte ALCOA+ Poster
  2. Technologie. Der technologische Umgang mit Daten wie APIs zu den verschiedenen Speicherplätzen, Sicherheit von externen Zugriffen oder auch Angriffen, Lesbarkeit über Jahre, etc..

4-Schritte für die erfolgreiche Umsetzung (Hefti 2019)

Fazit

Technologie wird oft überschätzt, Walcott (2019): „10% macht Technologie aus, 90% Mensch und Kultur.“. Big Data und Data Science ist nicht neu, aber die Möglichkeiten sind durch neue Technologien und deren Leistungen enorm gewachsen. Was Firmen daraus machen ist dagegen offen. Daten zu erfassen ohne Wissen der Betroffenen ist heute schon gegeben und Schlüsse aus den Daten zu ziehen, welche Betroffene betreffen ohne dass sie es wissen ist heute schon Tatsache. Daten Wissenschaft ist heute und in Zukunft das neue Gold der Wirtschaft. Vielleicht gewinnt der Data Scientist die nächsten Wahlen?!