Sprachsteuerung für Business Software
Künstliche Intelligenz

13. November 2019 504 Aufrufe

Sprachsteuerung für Business Software

Sprachsteuerung für integrierte Unternehmenssoftware rückt in Reichweite. Wissenschaft und Wirtschaft arbeiten gemeinsam an praxistauglichen Sprachassistenten. Diese sollen mehr können als nur Diktate aufnehmen und simple Befehle ausführen. 

Der Unterschied zwischen Sprachsteuerung und Spracheingabe

Wenn Sie sagen „Hey Google, E-Mail an Susanne“ ist das ein Beispiel für Sprachsteuerung. Sie rufen ein Programm oder eine Funktion auf. Die Spracherkennung Ihrer Software interpretiert den gesprochenen Befehl als Anweisung, eine Funktion auszuführen. Sie ersparen sich damit das Navigieren und Klicken in Menüs.

Wenn Sie Ihre E-Mail dann diktieren, ist dies ein Beispiel für Spracheingabe. Sie sprechen Ihren Text, statt ihn einzutippen. Die Spracherkennung Ihrer Software interpretiert das Diktat als Eingabe in eine aktive Anwendung. Sie ersparen sich damit das Bedienen der Tastatur.

Sprachsteuerung

Anwendungen von Sprachsteuerung

Digitalunternehmen wie Google, Amazon, Apple und Microsoft haben ihre Apps mit Sprachsteuerung ausgerüstet. Siri, Cortana und Co. erkennen menschliche Sprache bereits recht gut. Durch künstliche Intelligenz werden sie immer besser darin. Auch Navis, Maschinen und Smart-Home-Geräte können Sie über Sprache steuern. Diese sind allerdings hauptsächlich für den B2C-Bereich ausgelegt.

Im Büro können Sie diktieren und Programme wie zum Beispiel eine Diktiersoftware oder die Microsoft Spracherkennung können Ihre Sprache in Text umwandeln. Die Spracheingabe in Windows 10 und Office 365 ermöglicht eine PC-Sprachsteuerung. Anbieter von Spracherkennungssoftware ermöglichen auch die Steuerung speziellerer Apps.

Enorme Datenmengen und Rechenleistungen schaffen ideale Bedingungen für KI und Sprachsteuerung. Es sieht also gut aus für eine Zukunft, in der niemand mehr klicken und tippen muss.

Was noch fehlt

In Business Software steht Sprachsteuerung noch am Anfang. Dabei ist der Bedarf groß: Mitarbeiter im Vertrieb, in Projekten, im Service und Kundendienst sitzen meist nicht am Schreibtisch.

Hände frei

Ärzte und Pfleger, Hotelmitarbeiter, Bauingenieure und viele andere Berufsgruppen brauchen ihre Augen und Hände, um ihre Kernaufgaben zu erfüllen. Diese Personen könnten sich mit Sprachsteuerung viel Zeit sparen. Warum tun sie es noch nicht? 

Qualität der Spracherkennung

Es gibt zwar spezielle Diktiersoftware für Juristen und Ärzte. Diese erkennt Fachausdrücke und lässt sich darauf trainieren, den Sprecher besser zu verstehen. Allerdings ist es oft mühsam, einer Spracherkennungssoftware neue Ausdrücke beizubringen und Fehler abzugewöhnen. 

Noch komplizierter wird es, wenn Sie eine Business Software mit Tausenden Funktionen nutzen. Anwender möchten keine roboterhaften Anweisungen geben. Sie möchten, dass die Software ihre normale Sprechweise versteht. Die Spracherkennungssoftware soll das Gewollte aus dem Gesagten erschließen. Fachleute sprechen von „Intent Parsing“. 

Prozesse per Sprache steuern

Es ist nett, einen Kalender oder Navi per Sprache bedienen zu können. Aber diese Anwendungen kommen schnell an ihre Grenzen. Anwender in Unternehmen möchten komplette Prozesse sprachlich abarbeiten können. Sie möchten mit Sprachbefehlen Berichte abrufen, Kontakte anlegen, Teams organisieren und Eingangsrechnungen prüfen können.

Vertraulichkeit gewährleisten

Viele Unternehmen schrecken vor Sprachsteuerung zurück, wenn die Technologie aus den USA kommt. Bekanntlich müssen US-Anbieter in ihren Software-Lösungen eine Hintertür für den Geheimdienst NSA offenhalten. Deutsche Anwender befürchten Industriespionage durch Erfassung ihrer sprachlichen Eingaben und Befehle.

Sprechen mit Kollege Computer

Anwender möchten mit ihren Apps in natürlicher Sprache reden. Software soll die Intention des Sprechers richtig verstehen und umsetzen. Sie soll „Neue Aufgabe an Sabine Müller, Bestandskunden-Kampagne anlegen bis 20.11.“ und „Sabine soll bis 20. November eine neue Kampagne für Altkunden vorbereiten“ genau gleich interpretieren.

Außerdem soll die Spracherkennung mit verschiedenen Sprechweisen umgehen können. Stimmlage oder Dialekt dürfen keinen Einfluss auf die Erkennung haben. Auch eine Dialogverarbeitung soll möglich sein. So könnten Sie beispielsweise eine ganze Reihe von Eingangsrechnungen in einem Frage-Antwort-Dialog freigeben.

A propos Antwort: Natürlich soll Ihnen die Software auch in natürlicher Sprache antworten. Ganz gleich ob Sie Informationen abfragen oder sich eine Agenda vorlesen lassen; das Endgerät soll intuitiv und natürlich mit Ihnen kommunizieren. 

Deutsche Sprachassistenz-Lösung

Unter der Federführung von Fraunhofer IAIS entsteht bald eine deutsche Sprachassistenzplattform für B2B. Das sogenannte Speaker-Projekt soll die Datensouveränität der anwendenden Unternehmen wahren und für B2B-Anwendungen einsetzbar sein. In dem Projekt entwickeln Forschungsinstitutionen zusammen mit Unternehmen eine praxistaugliche Sprachsteuerung für alle nur denkbaren digitalen Systeme. 

Robuste Spracherkennung

Die Qualität der Spracherkennung wurde in letzter Zeit deutlich verbessert. Die Fehlerquote wurde um 30 Prozent gesenkt. Künstliche neuronale Netze, die in mehreren Schichten gestaffelt sind, heben das maschinelle Lernen (Deep Learning) auf eine höhere Stufe.

Deep Learning

Technologien wie Audio Mining analysieren Multimedia-Inhalte und treiben die Erkennungsqualität voran. Bei der Spracherkennung muss die Erkennungsleistung allerdings bei etwa 95 Prozent liegen, um akzeptabel zu sein. Mindestens genauso wichtig ist es, Falscherkennungen zu vermeiden.

Anpassbares Vokabular

B2B-Anwendungen nutzen häufig ein bestimmtes Fachvokabular. Business Software muss mit diesem Vokabular „gefüttert“ werden, damit sie richtig funktioniert. Das Vokabular für Sprachsteuerung ist inzwischen frei definierbar und kann an bestimmte Software-Lösungen angepasst werden – von einfachen Steuerungsbefehlen bis hin zu komplexen Dialogsystemen. Die Spracherkennung arbeitet umso genauer, je besser das Vokabular an die Anforderungen der Einsatzbereiche angepasst ist.

Fazit: Sprachsteuerung für Business-Software

In den nächsten Jahren werden Künstliche Intelligenz, Spracherkennungssoftware und die wissenschaftlichen Grundlagen zur Sprachverarbeitung riesige Fortschritte machen. Das kommt bald auch den Nutzern von Unternehmenssoftware zugute.

Das Ziel ist es, komplette Prozesse sprachgesteuert abzuarbeiten. In Zukunft werden Nutzer mit ihrer Business Software ganz natürlich reden und verstanden werden. Umgebungsgeräusche und verschiedene Sprechweisen werden der robusten Spracherkennung nichts ausmachen.

Anwender, die ihre Hände und Augen für die eigentliche Arbeit brauchen – sei es im Projekt, im Kundenservice oder bei der medizinischen Versorgung – werden ganz nebenbei ihre Vorgänge dokumentieren und Software steuern können.  

Wir zeigen Ihnen, wie Sie von der Digitalisierung profitieren.

Ihr unverbindlicher Einstieg in die Scopevisio Welt

 
Hosted in Germany GoBD konform PwC zertifiziert
Gemeinsam im
Home-Office
Software für den Mittelstand
Kostenlos aus Solidarität
  • Software zum digitalen Arbeiten
  • Schnelle Software-Einführung
  • Digitale Trainings
  • Tägliche Webinare
  • Keine Kündigung notwendig