Digitale Assistenten nehmen uns Arbeit ab, sind praktisch und leicht zu bedienen. Doch was sind die sogenannten Voice Services überhaupt? Was können sie und was (noch) nicht? Hermann del Campo, CTO des ehemaligen Startups Multicast Media und Yoxxy. Aktueller Gechäftsführer der Firmen Zaibr Innovations und Novofundo Propertymanagement.
Die “Voice Services” halten Einzug in unsere Wohnzimmer. Es erinnert stark an Science Fiction, wenn man die Nutzer in ihrem zu Hause mit einer dieser Boxen reden sieht und diese Boxen dann sogar noch antworten. Doch handelt es sich hier nicht nur um Spielzeug oder nutzlose Gadgets, sondern um sprachgesteuerte digitale Assistenten, die uns im Haushalt helfen können.
Bei diesen Assistenten handelt es sich, vereinfacht ausgedrückt, um einen Bluetooth-Lautsprecher, versehen mit Mikrofonen und einem kleinen WLAN-fähigen Computer (zur Verarbeitung der Inhalte) und der entsprechenden Software-Engine vom Hersteller, sei es Amazon, Google, Apple oder Microsoft.
Amazon Echo
Amazon Echo ist einer dieser smarten Lautsprecher vom Online-Riesen Amazon. Als erstes auf dem Markt konnte er sehr schnell eine große Nutzerzahl gewinnen. Nach dem Release im November 2014 (USA), kam der Lautsprecher im Oktober 2016 auch nach Deutschland und gewann auch hier schnell an Beliebtheit. Alexa, wird das Gehirn hinter Amazon Echo genannt. Die Grundfunktionen, wie Wettervorhersage, Abspielen von Musik, sowie Allgemeine Informationen, können durch kleine Erweiterungen, hier Skills genannt, ergänzt werden. Auf der deutschen Skill-Plattform existieren bereits mehr als 1.200 verfügbare Skills, die von Smart Home, über Informationen und schlussendlich zu Entertainment reichen. Amazon Echo hat seine Stärken in einem gesunden Mix aus künstlicher Intelligenz und klangvollem Lautsprecher angesiedelt.
Google Home
Google hat auf der I/O-Konferenz 2016 seinen eigenen Voiceservice vorgestellt: Google Home. Das System arbeitet auf Basis des Google Assistenten.
Im Sommer 2017 soll der Smarte Lautsprecher auch nach Deutschland kommen und auch hier Amazon Echo die Stirn bieten. Die Erweiterungen der Fähigkeiten heißen bei Google Home Actions. Im Gegensatz zu Amazon Echo fokussiert sich Google eher auf die künstliche Intelligenz, als auf die Qualität von Klang und Audio. In der täglichen Nutzung merkt man schnell, dass Amazon Echo an seine Grenzen stößt, wenn man Fragen stellt die aufeinander aufbauen. Google Home ist hier definitiv im Vorteil, er versteht auch komplexere Fragen ohne Probleme. Leider fehlt bei Google Home die Plattform für die Verwaltung und Nutzung von Actions, die es bei Amazon Echo schon gibt.
Apple Homepod
Anders tritt der iPhone-Erfinder Apple an die Voiceservices heran, wie erst kürzlich im Juni 2017 bei der Apple Keynote vorgestellt. Apple hat mit Siri schon seit längerem eine künstliche Intelligenz im Portfolio. Siri arbeitet auf fast allen Apple-Devices und soll auch im HomePod zum Einsatz kommen. Im Gegensatz zu Amazon Echo und Google Home soll der Apple HomePod auch umgangssprachliche Kommandos verstehen und nicht nur fest einprogrammierte Sprachbefehle.
Weiterhin setzt Apple mit seinem digitalen Sprachassistenten nicht vordergründig auf die künstliche Intelligenz, sondern voll und ganz auf qualitativ hochwertigen Klang. Der Apple HomePod soll über Sensoren verfügen, welche den aktuellen Raum abtasten, um dem Nutzer das perfekte Klangerlebnis zu ermöglichen. Erscheinen soll der HomePod Ende 2017 in den USA und 2018 in Deutschland.
Microsoft Cortana
Ganz aus dem Raster schießt Microsoft Cortana mit seiner Künstlichen Intelligenz: Microsoft plant nicht einmal die Herstellung eines eigenen Voiceservices. Sie nehmen ihre künstliche Intelligenz “Cortana” und bauen diese in den smarten Lautsprecher von Harman & Kardon und HP ein und vermeiden so die Schlacht auf dem heiß umkämpften Markt der sprachgesteuerten Assistenten. Als besonders kluger Schachzug, kann man jedoch die direkte Implementierung in sämtliche Windows Lösungen.
Mikrofone, die die ganze Zeit zuhören können
Die Technik hinter den Voiceservices ist der nächste Schritt in die Zukunft und begeistert bereits viele. Doch vor dem Kauf solcher “Smart Speaker” muss man sich auch bewusst sein, man holt sich Mikrofone ins Haus, die die ganze Zeit zuhören können (es sei denn man schaltet sie “stumm”). Die Algorithmen der Unternehmen analysieren die Fragen und Befehle, um die Customer Experience stetig zu verbessern bzw. Datenbanken zu füttern.
Allerdings wollen wir hier nicht den sprichwörtlichen Teufel an die Wand malen. Denn tatsächlich sind diese Sprachassistenten Touchpoints. Sie bekommen ein Signal, prüfen in der Cloud, was dieser Befehl besagt und lösen eine Handlung auf dem Gerät aus. Heißt, Inhalte einer Radiostation, die über Alexa und Co ausgespielt werden, sind NICHT auslesbar von us-amerikanischen Systemen oder Datenbanken.
Der nächste Schritt in Richtung Zukunft
Trotz des Datenschutzes und der Sicherheitshinweise ist diese Technologie der Anfang einer neuen Ära. Nach analoger, über digitaler Touch-Bedienung, geht der Trend nun in die auditiv steuerbare Bedienung und ermöglicht so eine Vielzahl von weiteren Möglichkeiten. Der Nutzer kann mit seiner Stimme die Befehle ausführen, ohne einen Knopf zu drücken oder sich visuell anzeigen lassen zu müssen. Diese Maschinen werden immer besser.
Ich frage Siri, Alexa und Co – und sie antworten. Immer präziser. Und das bedeutet, dass immer mehr Menschen diese Art der Kommunikation auch nutzen werden. Aktuelle Studien sagen voraus, dass in den USA im Jahr 2020 – und das ist in gut zweieinhalb Jahren – die Hälfte aller Suchanfragen über Voiceservices laufen werden. Noch als Trendprodukte belächelt, haben diese sprachgesteuerten Assistenten durchaus Potential für eine globale Verbreitung.
Plötzlich ist Radio wieder im Wohnzimmer
Wie aus den Studien hervorgeht, ist diese Technologie vor allem im Bereich der Mediengattung Radio ein äußerst interessanter und massentauglicher Kanal, der unbedingt beachtet werden sollte. Plötzlich ist Radio wieder im Wohnzimmer, es verlässt seine Nischenrolle als Nebenbeimedium im Auto oder unter der Dusche. Eine konservative und abwartende Strategie in den wichtigsten Images Musik, inhaltliche Themenumsetzung, moderative Ansprechhaltung, Comedy und Nachrichten wäre ab sofort “realitätsfern”. Schnell wird klar, dass die Schlacht um die Inhalte begonnen hat – hier geht es um Zweit- und Drittverwertung, als On-Demand oder Subscription-Modell.
Voice Services können überall angebunden werden – im Auto oder auf dem Crosstrainer
Einst professionelle Stationen verschenken schnell ihr gesamtes Potenzial, wenn sie vor dem Digitalisierungsprozess die Augen verschließen. Und Alexa und Co. sind nur der Anfang! In Zukunft nehmen wir Alexa oder Siri von Zuhause mit auf die Reise – zur Arbeit, ins Fitnessstudio, in den Urlaub. Denn die Voiceservices können überall angebunden werden – im Auto, auf der Arbeit, im Hotelzimmer auf Samos oder auf dem Crosstrainer.
Audio wird in der Zukunft eine entscheidende Rolle spielen – Radiostationen haben schon Vorteile, die nur erkannt und genutzt werden müssen.