Aus dem Unterricht des CAS Digital Finance mit Markus Maurer (Head of Farner Lab) berichten Daniela Castro und Philip Anklin:

Für einmal wurden wir nicht im HWZ Gebäude, sondern bei der Farner Consulting AG von Markus Maurer, Head of Farner Lab empfangen. Der erste Eindruck zeigt ein hochmodernes Büro mit der neuesten Voice User Interface Technologie. Google Gefühl kommt auf.

Farner LAB Meeting Room in Zürich

Farner Lab Meeting Room in Zürich

Farner Lab beschäftigt sich mit neuen Technologien, welche unter anderem Einfluss auf die Kommunikation haben. Diese ist allgegenwärtig präsent.

Voice User Interface (VUI)

Ziel des heutigen morgens ist, uns aufzuzeigen, was für einen Einfluss die Voice User Interface (VUI) auf die Gesellschaft hat. Wir sollen ein Gefühl für diese bereits bestehende Technologie entwickeln. Ausserdem geht es darum zu verstehen, wie sie sich an Nutzerbedürfnisse anpassen wird.

VUI gehört zu den grossen digitalen Trendthemen. Sprachassistenten wie Alexa, Google Assistant oder Siri sind sprichwörtlich in aller Munde und befinden sich mittlerweile in unzähligen Endgeräten, Anwendungen und Smart-Home-Lösungen. “VUI – Everywhere!”

We are moving towards an app-less world, and conversational interfaces allow us to ‘reach people in the channels they already massively use most of the time, instead of fighting a hopeless battle to drive them to niche, standalone apps they infrequently visit.’
(Meydad Marzan, UX Manager at Google)

VUI ist in der Hinsicht eine Revolution, dass Menschen mit Maschinen sprechen und diese mitdenken können. Denn immer mehr Suchanfragen werden per VUI gestellt. Dies zeigt ebenfalls eine Veränderung des Nutzerverhaltens. “Sprechen anstatt Tippen ist die Devise”. Es wird weniger mit Stichwörtern gesprochen, sondern es werden Fragen in ganzen Sätzen gestellt. Zum Beispiel, “Wo steht der UBS Aktienkurs heute?”. Dabei sind die 5 W-Fragen ausschlaggebend.

Search Engine Optimization (SEO)

Die sprachbasierte Search Engine Optimization (SEO) wird völlig neu definiert. Denn entgegen der textbasierten SEO sollen die Textpassagen eine laute Lesbarkeit in natürlichem Sprachfluss gewährleisten. Demzufolge sollen sie nicht mit Keywords vollgestopft und mit Titeln und Untertitel überstrukturiert sein. Die Suche ist nicht mehr endlos, sondern man erhält zur gestellten Frage eine Antwort. Das heisst weniger Output mit höherer Relevanz.

Voice First

Die Studie “Voice First” 2018 von Farner Consulting AG in Zusammenarbeit mit der Universität Luzern und Swisscom zeigt, dass in der Schweiz bereits 37% der Bevölkerung VUI nutzen, 15% davon tun dies täglich. Gespannt sind wir auf die aktuelle Studie, welche im Dezember 2019 erscheinen soll. Die Anzahl der Nutzer dürfte hier markant gestiegen sein.

Gemäss Markus Maurer vertraut die heutige Jugend VUI. Der Sprachassistent ist eine ehrliche Technologie mit ehrlichen Antworten, oder kurz: kinderfreundlich und leicht zu verstehen.

Auf dem Markt gibt es bereits weltbekannte Akteure, welche in dieser Hinsicht unterschiedlich positioniert sind. Hauptakteur in der Schweiz ist Google. Wieso ist dies so? Schauen wir uns doch die Drahtzieher genauer an:

Auswahl Hauptakteure Voice User Interfaces

  • Amazon Alexa: Leider in der Schweiz nur mit Workarounds und nicht “offiziell” verfügbar. Amazon will mit dem Sprachassistent hauptsächlich sicherstellen, dass die Produkte auf Amazon über jeden erdenklichen Kanal gekauft werden können (Multichannel-Management).
  • Microsoft Cortana: Hat die Plattform und wäre auf vielen Microsoft Geräten verfügbar, ist aber momentan noch zu kompliziert aufgestellt.
  • Google Assistant: Steht im Schweizer Ecosystem zur Verfügung. Die Client Experience ist im Fokus. Google möchte, dass der Kunde eine gute Erinnerung hat und gerne wieder zurück kommt.
  • Apple Siri: Geschlossenes System, dass heisst nur Apple Produkte sind kompatibel. Apple hat eine gute Ausgangslage müsste aber die Technologie besser im Griff haben. Das geschlossene System macht Wachstum schwierig.
  • Snips: Eigenständige Plattform (stand-alone). Wäre interessant für Banken durch die Wichtigkeit von Datenschutz und Privacy. Diese Plattform kann selber gehostet und betrieben werden. Vor allem ist die Nutzung ohne Internet möglich, jedoch muss die Hardware selbst betrieben werden.

Alle diese Akteure arbeiten mit Voice First Interaction Systemen (Mobile first), welche Benutzereingaben über Sprachbefehle entgegennimmt und mit dem Nutzer via Sprachausgabe kommuniziert.

Kurz gesagt herrscht momentan ein Plattformkrieg. Gemäss Markus Maurer müssen sich die Unternehmen zukünftig finden, um wachsen zu können.

Ausschlaggebende Technologien

Diese Technologien erlauben multimodale Erlebnisse. Mehrere Kanäle zur Ausgabe sind wichtig. Ein gutes Beispiel hier ist das Altersheim: Leuten, die sich einsam und alleine fühlen, helfen diese Technologien, sich gehört zu fühlen. Das heisst die Geräte sind das eine, die Nutzung dieser ist das andere.

Gruppenübung “Mensch-Maschine-Interaktion”

Um von der Theorie in die Praxis einzutauchen, konnten wir anhand einer Gruppenübung die “Machine-Human-Voice-Interaction” nachspielen. Vier Gruppen hatten die Aufgabe sich einen Namen für eine “Voice App” auszudenken und diese mittels eines kurzen Dialogs zum Leben zu erwecken. Der Kreativität waren keine Grenzen gesetzt, so entstanden Namen wie “SergioAdvisor” oder “Pazienza” um nur zwei zu erwähnen. Bei SergioAdvisor handelt es sich um einen Sprachassistenten für Investitionsberatung bei Privatkunden und bei Pazienza um einen Sprachassistenten für medizinisches Personal um Abfragen sowie Mutationen im Patientendossier vorzunehmen.

“Pazienza” Dialog

Im Farner Lab sind verschiedenste Voice Devices vorinstalliert wie Amazon Alexa und Echo, Google Nest Mini sowie Sonos. Dies bot uns die Möglichkeit, unterschiedliche Dialog-Szenarien auszutesten. Während der Präsentation und den Diskussionen haben sich aufgrund Keywörter wie “OK Goole”, “Alexa” die Sprachassistenten ungewollt automatisch aktiviert und mitdiskutiert, was zugegebenermassen sehr spooky war.

Kurzer Exkurs: Sonos ist plattformunabhängig, der Benutzer hat also die Möglichkeit entweder Google oder Amazon als Voice Assistant einzusetzen.

VUI im Einsatz

Nachfolgende Beispiele zeigen eindrücklich wo VUI bereits erfolgreich eingesetzt wird:

  • Google Duplex telefoniert mit Geschäften um Termine zu vereinbaren.
  • Mit dem Voice Banking der Sparkasse können Kontostände abgefragt oder Ein- und Ausgänge auf dem Konto überprüft werden.
  • Seit längerem bietet Capital One Voice Banking an um Kontostände abzufragen oder Zahlungen auszuführen.
  • Real-time Sprachübersetzungsgeräte sind bereits im Einsatz und funktionieren mit ein paar Sekunden Verzögerung sehr gut. In Zukunft wird diese Technologie in den jetzigen Audio-Kopfhörern integriert sein.
  • Das Walliser Parlament hat eine Sprachtechnologie im Einsatz welches ein automatisches Protokollieren der Gespräche ermöglicht.
  • Seit kurzem unterstützt Google Assistant auch die Steuerung von Luftbefeuchtern und -entfeuchtern sowie smarte Badewannen und Wasserhähne.

Voice Map Switzerland

HWZ und Voice Meetup Switzerland bringen die erste Übersicht zur Voice User Interface Landschaft der Schweiz.

Voice Map Switzerland Beta

Die Voice Map Switzerland Beta bietet eine erste fundierte Übersicht zur VUI Landschaft in der Schweiz und zeigt verschiedene Institute und Unternehmen mit direktem Bezug zu VUI.

Voice Map Switzerland Beta

Fazit

Stimmerkennung, ob wir wollen oder nicht, tangiert uns bereits heute und vereinfacht das Leben in vielerlei Hinsicht. Beispielsweise bei der täglichen Abfrage nach News, Wetterprognosen oder E-Mails, für das Schreiben von Nachrichten, für Kalendereinträge, Routenplanung inkl. Wegbeschreibung, Devisenmarkt-Informationen, Notizen, Einkaufslisten und Reminders, Musiktitel abspielen lassen und, und, und. Die Informationsverfügbarkeit erfolgt in kurzer Zeit und in wenigen Schritten. Die Sicherheit gerät bei dieser Thematik nicht in Vergessenheit. Ziel sollte primär sein, die Chancen von VUI zu erkennen und sich mit Thema VUI auseinanderzusetzen. Parallel dazu muss die Datensicherheit und Privatsphäre sichergestellt sein.

Lange Rede kurzer Sinn, entscheiden wird der Mensch, inwieweit und inwiefern der Datenaustausch und die Kommunikation in Bezug auf VUI stattfinden wird.

Ausschlaggebend ist, dass Unternehmen und die Menschen früh genug beginnen, sich mit diesen Technologien auseinanderzusetzen und mit einfachen Prototypen und vordefinierten Testpersonen analysieren und hinterfragen, um die Erfahrungskurve zu verbessern und aufzuzeigen, was der Mensch wirklich will und braucht.