Die Stimme ist dabei, unsere Hassliebe zu den Maschinen zu reparieren

Seit Jahren interagieren wir mit Maschinen so, wie sie es diktiert haben, per Touch – per Tastatur, Bildschirm oder Maus. Aber das ist nicht der natürliche Weg für den Menschen zu kommunizieren. Als Menschen bevorzugen wir die Stimme. Im Jahr 2018 werden wir mehr Maschinen sehen, die so kommunizieren wie die Menschen, mit dem Potenzial, dass sich die Technologie mehr denn je in unser Leben einfügt.

Wir stehen am Anfang einer sprachgesteuerten Technologietransformation, bei der neue Arten von Geräten und Diensten, wie Echo und Alexa, uns eine natürlichere Kommunikation ermöglichen. Sie werden in alles eingebettet, vom Auto über die Hausautomation bis hin zur Fabrikhalle.

Ford zum Beispiel hat Alexa in seine Fahrzeuge integriert, so dass sich seine Kunden intuitiver mit seinen Autos beschäftigen können. Fahrer können mit ihrem Auto sprechen und es bitten, ihre Lieblings-Hörbücher abzuspielen. Sie können ihre Einkäufe erledigen und sich eine Wegbeschreibung besorgen. Sie können sich mit allen Arten von Diensten außerhalb des Fahrzeugs verbinden und so Lichter und Türen in ihremSmart Home manipulieren. Von zu Hause aus können Kunden mit ihrem Fahrzeug kommunizieren, indem sie die Türen ferngesteuert starten, verriegeln oder entriegeln und Fahrzeuginformationen abrufen.

Dies unterscheidet sich grundlegend von der alten Freisprecheinrichtung, die eine einzige befehlsgesteuerte Schnittstelle war. Diese modernen Sprachsysteme basieren auf Gesprächen, die einen mehrstufigen, zustandsorientierten Ansatz verfolgen. Beispiele sind Diagnosen für die Gesundheitsberatung, Kreditkartenanträge oder die Interaktion mit Behörden. Das ist nur ein Vorgeschmack auf das, was möglich sein wird.

Bis Ende 2018 wird Voice die Art und Weise, wie Geräte und Anwendungen gestaltet werden, verändert haben. Es wird auch auf dem Weg sein, die primäre Schnittstelle zu werden, über die wir uns mit der Technologie und der Welt um uns herum beschäftigen. Wir fangen schon an, das am Arbeitsplatz zu sehen. Nehmen Sie AstraZeneca, wo Alexa von Produktionsteams verwendet wird, um nach den Standardverfahren zu fragen und herauszufinden, was als nächstes zu tun ist. In der Nasa, anstatt einen Konferenzraum für verschiedene Missionstreffen umzugestalten, sprechen sie mit Alexa und das Gebäude erledigt den Rest. Für viele ist Voice Computing bereits da, und das Potenzial ist grenzenlos.

Wenn man bedenkt, dass es Menschen auf der ganzen Welt gibt, die noch nie mit Computern und Smartphones oder Schnittstellen wie Tastaturen oder einer Maus in Berührung gekommen sind, wird die Kommunikation mit der Technologie natürlich noch wichtiger.

Das International Rice Research Institute, in der Nähe von Manila auf den Philippinen, hat ein digitales System entwickelt, das den Landwirten hilft, die richtige Menge an Dünger zu einem bestimmten Zeitpunkt auf ihr Land zu bringen. Um das Engagement zu erhöhen, entschied man sich für eine natürliche Schnittstelle für die Landwirte und baute sie als sprachbasiertes System in der Wolke auf. Die Bauern nehmen einfach das Dorftelefon, rufen den Service an, wählen aus einer Vielzahl von Dialekten und beschreiben das Land. Der Service, der maschinelles Lernen einsetzt, gibt Auskunft darüber, wie viel Dünger sie benötigen und wann sie ihre Pflanzen pflanzen sollten.

Die Popularität von Sprache als Hauptzugangsmedium für digitale Dienste bedeutet, dass im Jahr 2018 Rückensysteme anders aufgebaut werden. Früher waren sie seitenbasiert – wie z.B. Green-Character-Terminals oder mobile Karten. Jetzt werden sie als intelligente, mehrstufige Dialogschnittstellen gebaut.

Entscheidend für die schnelle Weiterentwicklung dieser sprachbasierten Technologien ist die Cloud und die damit verbundenen enormen Rechenressourcen. Die Cloud liefert die Bausteine, die Kunden benötigen, um Konversationssysteme zu entwickeln, die viel natürlicher sind und sich wie ein Gespräch mit einer Person anfühlen. Die größte Herausforderung bei sprachbasierten Systemen besteht darin, sie so natürlich wie möglich zu gestalten, vor allem bei Publikum in Entwicklungsländern oder bei älteren Generationen, die nicht technisch versiert sind. Nehmen wir das britische Inhealthcare als Beispiel. Eines der wichtigsten Instrumente ist die Nutzung der automatisierten Telefonie als Kommunikationskanal für die flächendeckende Bereitstellung digitaler Gesundheitsdienste.

Für viele ältere Menschen ist das Telefon ein Stück Technologie, das sie bequem und sicher nutzen können, und fast jeder kann darauf zugreifen, auch wenn er keinen Zugang zum Internet oder zu einem Smartphone hat. Mit Amazon Polly kann Inhealthcare Erinnerungen an Medikamente, Gesundheitsratschläge und Hilfe bei der Behandlung liefern. Ein Telefonanruf kann je nach Komplexität seiner Natur einige Sekunden bis Minuten dauern, aber mit der geringen Latenz, die sie erreichen können, können Patienten ein natürliches Gespräch führen, was bedeutet, dass sie sich mit dem Rat, den sie erhalten, wohl fühlen und nicht auflegen.

Das ist erst der Anfang von dem, was möglich ist. Wir werden sehen, dass intelligentere Dienste nicht nur lernen, mit uns zu sprechen, sondern beginnen, Emotionen zu erkennen, sich zu engagieren und sinnvolle Gespräche zu führen. Im Jahr 2018 ist es wahrscheinlich, dass Reden das Tippen ersetzen könnte.

Das könnte dir auch gefallen