Der Siegeszug der digitalen Sprachassistenten

Künstliche Intelligenz

Die Sprachsteuerung zur Mensch-Maschine-Interaktion

Digitale Assistenten zur Erkennung von Sprache gibt es nicht erst seit gestern. Aber nun schlägt die Stunde ihres Siegeszugs. Scopevisio stellt Ihnen ihre Anwendungsbereiche sowie ihre Auswirkungen auf unsere Gesellschaft vor.

29. August 2017 1552 Aufrufe
Nicht erst mit Star Wars drang das Bild von Robotern in unsere Vorstellung, mit denen wir uns intelligent unterhalten können – also wie mit einem (annähernd intelligenten) Menschen. Die Aussicht, mit Maschinen mittels direkter Kommunikation zu interagieren, anstatt nur immer wieder dieselben Knöpfe zu drücken und Hebel zu ziehen – das hat den Ehrgeiz der technologischen Pioniere vorangetrieben. Die Anwendungsmöglichkeiten scheinen unbegrenzt. Ob im Alltag, in der Verwaltung, in der Industrie, im Auto: quasi allen Bereichen des Lebens steht zumindest die Möglicheit offen, durch intelligente und sprechende Maschinen bereichert zu werden. Und ob uns unser digitaler Sprachassistent jeweils eher wie ein amerikanischer Gebrauchtwarenhändler oder wie ein britischer Butler begegnet, das liegt allein in der Hand des Menschen. Computer und Maschinen machen ungeheure Fortschritte im Verständnis menschlicher Sprache. Nach Einschätzung des amerikanischen Elektronik-Branchenverbandes CTA dürften Maschinen noch dieses Jahr erstmals gesprochene Worte annähernd so gut verstehen wie Menschen. 2013 hatte die Fehlerquote noch bei 23 Prozent gelegen. Scopevisio informiert Sie über die gegenwärtigen Neuheiten und einige spannende Themenfelder in der Welt der Mensch-Maschine-Interaktion.

Sprachsteuerung für digitale Assistenten

Schon die CeBIT 2017 hat gezeigt: Sprachsteuerung wird besonders oft für digitale Assistenten eingesetzt. Diese kleinen Programme, auch Chatbots genannt, verstehen Anweisungen von menschlichen Anwendern und können Fragen beantworten. Die Sprachsteuerung trägt Namen wie Alexa, Cortana, Google Now, Siri oder Scoper und erleichtert die Bedienung von Smartphones und Büroanwendungen. Auf der Technikmesse CES in Las Vegas Anfang 2017 ließ die CTA verlauten, dass alleine in diesem Jahr fünf Millionen digitale Assistenten verkauft werden dürften. Der Siegeszug der Künstlichen Intelligenz (KI) wird diese Entwicklung zusätzlich ankurbeln. KI ermöglicht eine selbstlernende Spracherkennung. Das Spracherkennungsmodul kann im Laufe der Zeit immer mehr sprachliche Äußerungen verstehen und selbst hervorbringen, weil es permanent dazulernt. Es erkennt Muster in gesprochenen Texten und lernt allmählich, diese Muster einzuordnen und zu interpretieren. Irgendwann werden wir mit den digitalen Assistenten beinahe so sprechen können, als wären es Menschen.

Was leisten die Sprachassistenten?

Eine konsequent angewandte Sprachsteuerung kann die Produktivität in vielen Unternehmen steigern: Die Masse der zu bearbeitenden Daten wird nicht weniger, die zur Verfügung stehende Zeit dagegen meist knapper, die Konkurrenz tut einem auch selten den Gefallen, ruhig zu schlafen, während man selbst im Organisationschaos versinkt. Digitale Helfer aber beschaffen die nötigen Informationen schneller und vollständiger als es bei manuellem Suchen der Fall wäre. Die Hürden eines exponentiell wachsenden Datenbergs bestehen für die KI nicht. Und sie kann, mit dem entsprechenden Sprachmodul ausgestattet, diese Informationen verständlicher formulieren – sogar in verschiedenen Sprachen.

Sprachsteuerung im Büro

Digitale Assistenten werden zunehmend im Support und im Online-Kundenservice eingesetzt. Vor technischen Schwierigkeiten ist kein Privatmann gefeit. Gerade in modernen Zeiten mit wachsender Technologisierung des Alltags stößt man besonders in Gewöhnungsphasen an seine Grenzen und verzweifelt an den neuen Herausforderungen. Abhilfe schaffen mehr und mehr digitale Sprachassistenten. Über ihren Datenspeicher können sie unverzüglich die richtigen Antworten liefern. Gerade in schwierigen Fällen müsste ein menschlicher Gesprächspartner die korrekten Informationen vielleicht erst zusammensuchen oder zeitintensive Rückfragen anstellen. Zugleich müsste sich der Kunde nicht mehr mit eventuell gestressten oder unleidigen Beratern auseinandersetzen: Geduld und Stimmung eines digitalen Sprachassistenten werden durch kein noch so großes Unverständnis des Kunden belastet. Von Vorteil ist auch die Lernfähigkeit der Maschinen: Wiederkehrende Fragen werden sofort beantwortet. Änderungen bei Prozessen werden augenblicklich gelernt und umgesetzt.

Hände und Augen bleiben frei

Diese Fähigkeit ist in der Logistik und der Maschinenbedienung besonders praktisch. Ein Hersteller von Sprachsteuerungslösungen für die Logistik verheißt Produktivitätssteigerungen von fünf bis 25 Prozent bei Lagerprozessen. Lagerarbeiter müssen nicht mehr innehalten, um Daten in ein Terminal einzugeben. Sie haben beide Hände frei und können sich auf ihre Kernaufgaben statt auf einen Bildschirm konzentrieren.

Anwendungen in der Gastronomie

In einem Vergnügungspark im Südwesten Japans steht ein etwas anderes Hotel. Das Henn-na Hotel (wörtlich in etwa „Merkwürdiges Hotel“) in der Nähe von Nagasaki kommt fast ohne menschliches Personal aus. An der Rezeption steht eine adrette junge Dame (mitunter auch ein adäquat gekleideter Dinosaurier). Dieser Rezeptionist entpuppt sich bei genauerem Hinsehen als Roboter. Die Dame schaut mit professionellem Lächeln nach, ob ein Zimmer für Sie frei ist und kann sogar Small Talk mit den Gästen machen – derzeit auf Japanisch, Chinesisch, Koreanisch und Englisch (wenn auch mitunter etwas abenteuerlich). Manager Sawada möchte eine ganze Kette solcher Hotels einrichten. Das Konzept liegt darin, dass Ankunft, Unterbringung, Aufenthalt und Versorgung des Gastes im Idealfall ohne menschliches Hotelpersonal auskommt. Ein Luxuxhotel ist das Henn-na Hotel allerdings nicht. Auf den Zimmern gibt es Kühlvorrichtungen (gewissermaßen umgekehrte Heizkörper) anstatt Klimaanlagen und keine Kühlschränke. Dies hängt mit dem Zweck des Hotels zusammen, Kosten zu sparen: Da zum Beispiel keine Personalkosten anfallen, kann Herr Sawada seine Zimmer billiger anbieten als der Wettbewerb. Der Einsatz moderner Technologie zeigt sich dabei als sehr innovativ, dem Kunden den Aufenthalt so angenehm wie möglich zu gestalten. Natürlich funktioniert nicht alles im Hotel sprachgesteuert. Den Eintritt ins gebuchte Zimmer gewährt ein Gesichtserkennungs-Programm. Ob sich ein Gast nähert, erkennen die Türen mittels Kamera. So eigenartig und teilweise bizarr alles vor allem für westliche Augen wirken mag, Herr Sawada hat besonders mit dem Aushängeschild der sprechenden Assistenten-Maschinen einen neuen Pfad in der Gastronomie betreten und ein gehörges Maß an Innovation bewiesen.

Korrekte Auskünfte in Echtzeit

Viele sind von den Möglichkeiten des digitalen und technologischen Fortschritts fsaziniert, mögen es aber doch etwas weniger plastisch als im Henn-na Hotel. Aber es ist dennoch absehbar, dass sich beispielsweise Empfangsdamen und -herren vielleicht schon bald nach einem neuen Betätigungsfeld umsehen müssen. Das Gleiche gilt für viele Call-Center-Mitarbeiter. Wo immer Informationen aus Datenbanken abgerufen und in sprachliche Äußerungen übersetzt werden können, sind Computer dem Menschen überlegen. Erinnern Sie sich an die sprachgesteuerten Assistenten im Support? Angenommen, Sie betreten ein großes Verwaltungsgebäude und suchen nach einem bestimmten Mitarbeiter. Eine menschliche Kraft, die gut gelaunt und wohlorganisiert – und damit auch nicht ganz billig – ist, wird in ihrem Computer nachschauen (das dauert einen Moment) und sagen: „Herrn Müller finden Sie im dritten Stock, vierte Tür links, Zimmer Nummer 3.14.“ Eine schlecht gelaunte Kraft auf Minijobber-Tarif wird Sie vielleicht angähnen und sagen: „Dritter Stock.“ Ein digitaler Assistent könnte freundlich und in Echtzeit antworten: “Ihren Fall bearbeitet Herr Müller. Er ist im Moment nicht im Büro. Er wird in einer halben Stunde zurück erwartet. Möchten Sie einen Kaffee?” Was bei Maschinen als Zeichen von Intelligenz und kluger Programmierung gesehen wird, könnte bei einem menschlichen Gesprächspartner beinah aufdringlich wirken.

Industrie 4.0

Die Sprach- und Gestensteuerung macht industrielle Prozesse effizienter, produktiver und weniger fehleranfällig. Industrie 4.0 bedeutet intelligente Vernetzung von Entwicklung, Herstellung, Logistik und Kundenprozessen. Sprachschnittstellen und Gesten-Erkennung können diese Vernetzung fördern und viele Aufgaben beschleunigen und erleichtern: Von der Fertigung über die Montage und Wartung bis hin zur Qualitätssicherung. 2 Roboter telefonieren Spracheingabe unterstützt auch die Schulung und Ausbildung von Fachkräften. Denn das Benutzerhandbuch der Zukunft ist ein Chatbot.

Sprachsteuerung im Automotive-Bereich

Klar, wir wissen aus Kindertagen: Knöpfchen drücken KANN auch Spaß machen, vorausgesetzt sie blinken schön und machen lustige Geräusche. Wenn man sich als Erwachsener aber auf der Autobahn wiederfindet und bei der Steuerung seines Fortbewegungsmittels von unzähligen Bedienvorrichtungen angestarrt wird, das mag den einen oder anderen verstören. Tatsache: Manche Automobile haben heutzutage so viele Knöpfe und Schalter wie ein mittlerer Düsenjet. Der Fahrer muss regelmäßig den Blick von der Straße nehmen, wenn er eine Funktion benötigt, die er nicht alle Tage benutzt. Und wenn er wieder aufblickt, ist vielleicht schon ein Reh auf die Straße gelaufen – oder der richtige Augenblick für den Turbo Boost verpasst. Spaß beiseite. Diese gefährliche Fummelei an überladenen Bedienpanels hat hoffentlich bald ein Ende. Der Fahrer der Zukunft wird mit seinem Auto sprechen. Ganz gleich, ob er den Navi nach dem Weg fragt oder die Sitzheizung einschalten möchte.

Sprachsteuerung im digitalen Heim

Bewohner eines “Smart Home” steuern heute schon ihre Spielkonsolen, Haustechnik, Fernseher und Bestellungen per Sprache. Wer morgens etwa nicht weiß, was er anziehen soll (und keinen Partner hat, der es ihm sagt), fragt kurz nach der Wettervorhersage (die übrigens ebenfalls computergeneriert ist).

Sprachsteuerung ermöglicht Inklusion

Die neue Technologie ist mehr als nur eine Spielerei. Sie verschafft Menschen, die durch Krankheit, Alter oder Behinderung eingeschränkt sind, einen ganz neuen Aktionsspielraum. Dagmar ist an den Rollstuhl gefesselt. Sie ist 19 Jahre alt und leidet an Spinaler Muskelatrophie (SMA). Diese Krankheit raubt den Betroffenen allmählich jede Mobilität, bis sie nur noch vom Hals aufwärts beweglich sind. Sprachsteuerung sorgt dafür, dass Dagmar heute Germanistik studieren kann. Sie lässt sich Fachtexte vorlesen und diktiert ihre Hausarbeiten in einen speziell ausgerüsteten Computer. Die Chancen stehen gut, dass Dagmar nach dem Studium einen normalen Beruf ausüben kann.

Fazit

Mensch-Maschine-Interaktion mittels Sprache ist eine Zukunftstechnologie. Was mit Siri begann, findet in digitalen Assistenten und Industrie 4.0 seine logische Fortsetzung. Selbstlernende Sprachanwendungen verstehen die Äußerungen der Benutzer jedes Mal besser. Sie beantworten Fragen kompetenter als mancher Service-Mitarbeiter es könnte. Sprachsteuerung bereichert unser Leben und macht viele Anwendungen einfacher. Sie wird allerdings dazu führen, dass einige niedrig qualifizierte Jobs in Zukunft wegfallen könnten.   Video 1: Scopevisio AG Video 2: danielsangeo Video 3: The Japan Times Video 4: JoelMuehlebach
Wir zeigen Ihnen, wie Sie von der Digitalisierung profitieren.
Kostenlose Beratungsanfrage


Das könnte Sie auch interessieren: