Wie funktioniert künstliche Intelligenz?

Watson ist die KI von IBM. Er ist ein kognitives System, das durch Interaktionen lernt, und liefert laut IBM „evidenzbasierte Antworten, die für bessere Ergebnisse sorgen.“

 

„Evidenzbasiert“ bedeutet, dass aus Daten und Fakten Einsichten gewonnen werden. Der Computer wertet Daten aus und zieht selbsttätig – aufgrund seiner einprogrammierten Pseudo-Intelligenz – Schlüsse aus diesen Daten.

 

Dahinter steht die Überlegung, dass die Datenmengen schon heute kaum mehr zu bewältigen sind und in den nächsten fünf Jahren um weitere 800 Prozent zunehmen werden. Was für Menschen unübersichtlich ist, liefert für selbstlernende Systeme ideale Bedingungen: Viel Stoff zum Lernen und Erkennen von Mustern.

So soll künstliche Intelligenz in den nächsten Jahren zunehmend die Unternehmen und die Arbeitswelt revolutionieren.

KI in Unternehmen

Alexa, Siri, Cortana – die Chatbots von Amazon, Apple und Microsoft sind Beispiele dafür, wie künstliche Intelligenz die Interaktion zwischen Mensch und Computer einfacher und effizienter macht. Auch der Scoper von Scopevisio fällt in diese Kategorie.

Hersteller von Unternehmenssoftware verwenden zunehmend intelligente Algorithmen, um ihren Kunden das Leben zu erleichtern. Virtuelle persönliche Assistenten durchforsten die Millionen von Daten, die sich im Unternehmen ansammeln, und filtern das heraus, was der Anwender benötigt. Die Zugriffsrechte für die angeforderten Informationen sind dabei die einzige Bedingung.

KI übernimmt Büroarbeiten

Büroarbeiten werden in Zukunft mehr und mehr von künstlicher Intelligenz unterstützt oder ersetzt. Maschinelle Übersetzung und Sprachproduktion sind nur zwei Beispielanwendungen. Künstliche Intelligenz lässt sich überall dort anwenden, wo Lösungen durch den Vergleich mit ähnlich gelagerten Problemen generiert werden können: Zum Beispiel für die Korrespondenz, die Erstellung von Berichten, Social Media-Postings oder die Finanzbuchhaltung.

Theoretisch könnten sogar Gutachten oder Gerichtsurteile von einer KI erstellt werden – Merkmale und andere Urteile, die in vergleichbaren Fällen ergangen sind, liegen in Hülle und Fülle vor. Es ist kein Problem, hier Muster zu erkennen und die „fitteste“ Lösung zu finden.

Die Algorithmen, auf denen KI basiert, werden im Folgenden untersucht.

Was ist ein Algorithmus?

Ein Algorithmus ist eine exakte, schrittweise Vorschrift zur Lösung eines Problems. Er besteht in einer Folge von eindeutigen Anweisungen. Er wird nicht unbedingt in einer Programmiersprache notiert, sondern oft auch als Flussdiagramm und in natürlicher Sprache.

Dennoch geht es letztlich immer darum, den Algorithmus in maschinenlesbarer Form zu implementieren. Das bedeutet, dass auf Grundlage der Verarbeitungsvorschrift ein Computerprogramm geschrieben wird, das das betreffende Problem löst.

Wodurch wird ein Algorithmus “intelligent”?

Heuristische Methoden

Viele künstliche Intelligenzen arbeiten mit heuristischen Methoden. Diese Methoden sind geeignet, schnelle Lösungen zum Beispiel in Entscheidungsbäumen zu finden. “Normale” Algorithmen brauchen vier Jahre, um einen Baum der Tiefe 15 und mit einer Verzweigungsrate von 3 zu durchforsten. Heuristische Algorithmen schaffen das in Sekunden, zum Beispiel, indem sie den kürzesten Pfad zwischen zwei Knoten in einem Netzwerk finden.

Dazu werden KI-Progamme geschrieben, die auf Schätzungen und Beobachtungen basieren – auf so genannter Fuzzy Logic oder unscharfer Logik. Viele Virenscanner implementieren Heuristik. Sie erkennen Viren anhand von typischen Merkmalen.

Erst kürzlich wurden zwei Jenaer Informatiker für ihre Weiterentwicklung der Lokale-Suche-Heuristik in Netzwerken ausgezeichnet.

Neuronale Netze

Neuronale Netze verfolgen einen Ansatz, der der Funktionsweise von Neuronen ähnelt. Künstliche neuronale Netze sind parallel verbundene Netzwerke aus einfachen, adaptiven Elementen in hierarchischer Anordnung, die mit ihrer Umgebung in derselben Weise wie biologische Nervensysteme interagieren. Diese etwas sperrige Definition stammt vom KI-Pionier Teuvo Kohonen (1984).

Neuronale Netze sind gekennzeichnet durch massive parallele Informationsverarbeitung. Sie haben mehrere Schichten. Sie leiten Informationen über künstliche Synapsen weiter (Propagation) und sind in der Lage zu lernen. Wie das? Indem sie gezielt trainiert werden und Schwellenwerte sowie Gewichte für Richtig-Falsch-Bewertungen in diesem Prozess immer neu anpassen. Die einzelnen Formeln, nach denen dies geschieht, dürfen hier ausgespart bleiben.

Gruppe hört einem Vortrag zu

Schematisch ist der Ablauf in der (kontrollierten) Trainingsphase wie folgt:

  • Beispiel-Daten werden dem Netz als Input übergeben.
  • Der Output für die Beispiele ist bekannt.
  • Der tatsächliche Output wird mit dem Soll-Output verglichen.
  • Wenn beide voneinander abweichen, werden Schwellenwert und Gewichte zwischen den einzelnen Schichten so angepasst, dass der mittlere Fehler zwischen Soll und Ist sinkt.
  • Fehlerdaten werden durch das Netz zurückgegeben (Backpropagation).

Systeme, die Muster erkennen, verwenden häufig neuronale Netze. Diese können auch mit unvollständigen und unklaren Input-Werten arbeiten und verschiedene Arten von Input aufnehmen – Wörter, Zahlen, Töne, Farben usw.

Dies macht neuronale Netze zu sehr guten Kandidaten, wenn es gilt, Sprach- oder Gesichtserkennung, Schrifterkennung (OCR), Data Mining oder allgemein wissensbasierte Systeme zu programmieren.

Genetische Algorithmen

Genetische Algorithmen wurden von John Henry Holland in den 1970er Jahren erfunden. Sie werden auch als evolutionäre Algorithmen bezeichnet, da sie ihre Problemlösungsmethoden aus der Evolutionsbiologie abgeschaut haben.

Sie kennen bestimmt Charles Darwins Diktum vom “Survival of the fittest”, dem Überleben des am besten angepassten Organismus. Genetische Algorithmen verwenden eine so genannte “Fitness-Funktion”, die mithilfe von genetischen Operatoren die natürliche Auslese simuliert.

Fitness-Funktionen implementieren diesen Ausleseprozess wie folgt:

  • Lösungen werden als binäre Zeichenfolgen (Bitstrings) codiert.
  • Der Input in den genetischen Algorithmus besteht aus mehreren Lösungsvorschlägen.
  • Diese bilden eine Population, in der die besten Lösungen die größten Fortpflanzungschancen haben.
  • Die Fitness-Funktion wählt die besten Lösungen aus und entscheidet über eine Rekombination von deren Bestandteilen.
  • Das Ergebnis sind Kreuzungen und Mutationen; so entstehen neue Lösungen.
  • Der Output ist die beste Lösung.

Fazit

Künstliche Intelligenz ist heute schon weit verbreitet. Sie arbeitet in Spielprogrammen, in Suchmaschinen, in Fahrassistenzsystemen, in maschinellen Übersetzungsprogrammen und in allen Anwendungen, die etwas “erkennen”. Dazu gehören Bilderkennung, Spracherkennung, Schrifterkennung, Gesichtserkennung.

Auch Hersteller von Unternehmenssoftware verwenden zunehmend KI-Anwendungen. Virtuelle persönliche Assistenten ermöglichen es, mit dem Computer zu sprechen. Selbstlernende Systeme werden schon bald einen Großteil der Büroarbeit leisten – ähnlich wie Roboter dies heute schon in der Industrieproduktion tun.

KI-Systeme arbeiten mit intelligenten Algorithmen. In diese Kategorie fallen heuristische Verfahren, künstliche neuronale Netze sowie evolutionäre (genetische) Algorithmen. Diese Algorithmen können Daten-Input entgegennehmen und Lösungs-Output ausgeben. Sie kopieren biologische und evolutionäre Mechanismen, um aus einer Menge von Lösungen die beste herauszufinden. In diesem Prozess “lernen” sie aus Fehlern und perfektionieren ihr Verhalten selbsttätig.

Der Siegeszug der digitalen Sprachassistenten

Nicht erst mit Star Wars drang das Bild von Robotern in unsere Vorstellung, mit denen wir uns intelligent unterhalten können – also wie mit einem (annähernd intelligenten) Menschen. Die Aussicht, mit Maschinen mittels direkter Kommunikation zu interagieren, anstatt nur immer wieder dieselben Knöpfe zu drücken und Hebel zu ziehen – das hat den Ehrgeiz der technologischen Pioniere vorangetrieben. Die Anwendungsmöglichkeiten scheinen unbegrenzt. Ob im Alltag, in der Verwaltung, in der Industrie, im Auto: quasi allen Bereichen des Lebens steht zumindest die Möglicheit offen, durch intelligente und sprechende Maschinen bereichert zu werden. Und ob uns unser digitaler Sprachassistent jeweils eher wie ein amerikanischer Gebrauchtwarenhändler oder wie ein britischer Butler begegnet, das liegt allein in der Hand des Menschen. Computer und Maschinen machen ungeheure Fortschritte im Verständnis menschlicher Sprache. Nach Einschätzung des amerikanischen Elektronik-Branchenverbandes CTA dürften Maschinen noch dieses Jahr erstmals gesprochene Worte annähernd so gut verstehen wie Menschen. 2013 hatte die Fehlerquote noch bei 23 Prozent gelegen. Scopevisio informiert Sie über die gegenwärtigen Neuheiten und einige spannende Themenfelder in der Welt der Mensch-Maschine-Interaktion.

Sprachsteuerung für digitale Assistenten

Schon die CeBIT 2017 hat gezeigt: Sprachsteuerung wird besonders oft für digitale Assistenten eingesetzt. Diese kleinen Programme, auch Chatbots genannt, verstehen Anweisungen von menschlichen Anwendern und können Fragen beantworten. Die Sprachsteuerung trägt Namen wie Alexa, Cortana, Google Now, Siri oder Scoper und erleichtert die Bedienung von Smartphones und Büroanwendungen. Auf der Technikmesse CES in Las Vegas Anfang 2017 ließ die CTA verlauten, dass alleine in diesem Jahr fünf Millionen digitale Assistenten verkauft werden dürften. Der Siegeszug der Künstlichen Intelligenz (KI) wird diese Entwicklung zusätzlich ankurbeln. KI ermöglicht eine selbstlernende Spracherkennung. Das Spracherkennungsmodul kann im Laufe der Zeit immer mehr sprachliche Äußerungen verstehen und selbst hervorbringen, weil es permanent dazulernt. Es erkennt Muster in gesprochenen Texten und lernt allmählich, diese Muster einzuordnen und zu interpretieren. Irgendwann werden wir mit den digitalen Assistenten beinahe so sprechen können, als wären es Menschen.

Was leisten die Sprachassistenten?

Eine konsequent angewandte Sprachsteuerung kann die Produktivität in vielen Unternehmen steigern: Die Masse der zu bearbeitenden Daten wird nicht weniger, die zur Verfügung stehende Zeit dagegen meist knapper, die Konkurrenz tut einem auch selten den Gefallen, ruhig zu schlafen, während man selbst im Organisationschaos versinkt. Digitale Helfer aber beschaffen die nötigen Informationen schneller und vollständiger als es bei manuellem Suchen der Fall wäre. Die Hürden eines exponentiell wachsenden Datenbergs bestehen für die KI nicht. Und sie kann, mit dem entsprechenden Sprachmodul ausgestattet, diese Informationen verständlicher formulieren – sogar in verschiedenen Sprachen.

Sprachsteuerung im Büro

Digitale Assistenten werden zunehmend im Support und im Online-Kundenservice eingesetzt. Vor technischen Schwierigkeiten ist kein Privatmann gefeit. Gerade in modernen Zeiten mit wachsender Technologisierung des Alltags stößt man besonders in Gewöhnungsphasen an seine Grenzen und verzweifelt an den neuen Herausforderungen. Abhilfe schaffen mehr und mehr digitale Sprachassistenten. Über ihren Datenspeicher können sie unverzüglich die richtigen Antworten liefern. Gerade in schwierigen Fällen müsste ein menschlicher Gesprächspartner die korrekten Informationen vielleicht erst zusammensuchen oder zeitintensive Rückfragen anstellen. Zugleich müsste sich der Kunde nicht mehr mit eventuell gestressten oder unleidigen Beratern auseinandersetzen: Geduld und Stimmung eines digitalen Sprachassistenten werden durch kein noch so großes Unverständnis des Kunden belastet. Von Vorteil ist auch die Lernfähigkeit der Maschinen: Wiederkehrende Fragen werden sofort beantwortet. Änderungen bei Prozessen werden augenblicklich gelernt und umgesetzt.

Hände und Augen bleiben frei

Diese Fähigkeit ist in der Logistik und der Maschinenbedienung besonders praktisch. Ein Hersteller von Sprachsteuerungslösungen für die Logistik verheißt Produktivitätssteigerungen von fünf bis 25 Prozent bei Lagerprozessen. Lagerarbeiter müssen nicht mehr innehalten, um Daten in ein Terminal einzugeben. Sie haben beide Hände frei und können sich auf ihre Kernaufgaben statt auf einen Bildschirm konzentrieren.

Anwendungen in der Gastronomie

In einem Vergnügungspark im Südwesten Japans steht ein etwas anderes Hotel. Das Henn-na Hotel (wörtlich in etwa „Merkwürdiges Hotel“) in der Nähe von Nagasaki kommt fast ohne menschliches Personal aus. An der Rezeption steht eine adrette junge Dame (mitunter auch ein adäquat gekleideter Dinosaurier). Dieser Rezeptionist entpuppt sich bei genauerem Hinsehen als Roboter. Die Dame schaut mit professionellem Lächeln nach, ob ein Zimmer für Sie frei ist und kann sogar Small Talk mit den Gästen machen – derzeit auf Japanisch, Chinesisch, Koreanisch und Englisch (wenn auch mitunter etwas abenteuerlich). Manager Sawada möchte eine ganze Kette solcher Hotels einrichten. Das Konzept liegt darin, dass Ankunft, Unterbringung, Aufenthalt und Versorgung des Gastes im Idealfall ohne menschliches Hotelpersonal auskommt. Ein Luxuxhotel ist das Henn-na Hotel allerdings nicht. Auf den Zimmern gibt es Kühlvorrichtungen (gewissermaßen umgekehrte Heizkörper) anstatt Klimaanlagen und keine Kühlschränke. Dies hängt mit dem Zweck des Hotels zusammen, Kosten zu sparen: Da zum Beispiel keine Personalkosten anfallen, kann Herr Sawada seine Zimmer billiger anbieten als der Wettbewerb. Der Einsatz moderner Technologie zeigt sich dabei als sehr innovativ, dem Kunden den Aufenthalt so angenehm wie möglich zu gestalten. Natürlich funktioniert nicht alles im Hotel sprachgesteuert. Den Eintritt ins gebuchte Zimmer gewährt ein Gesichtserkennungs-Programm. Ob sich ein Gast nähert, erkennen die Türen mittels Kamera. So eigenartig und teilweise bizarr alles vor allem für westliche Augen wirken mag, Herr Sawada hat besonders mit dem Aushängeschild der sprechenden Assistenten-Maschinen einen neuen Pfad in der Gastronomie betreten und ein gehörges Maß an Innovation bewiesen.

Korrekte Auskünfte in Echtzeit

Viele sind von den Möglichkeiten des digitalen und technologischen Fortschritts fsaziniert, mögen es aber doch etwas weniger plastisch als im Henn-na Hotel. Aber es ist dennoch absehbar, dass sich beispielsweise Empfangsdamen und -herren vielleicht schon bald nach einem neuen Betätigungsfeld umsehen müssen. Das Gleiche gilt für viele Call-Center-Mitarbeiter. Wo immer Informationen aus Datenbanken abgerufen und in sprachliche Äußerungen übersetzt werden können, sind Computer dem Menschen überlegen. Erinnern Sie sich an die sprachgesteuerten Assistenten im Support? Angenommen, Sie betreten ein großes Verwaltungsgebäude und suchen nach einem bestimmten Mitarbeiter. Eine menschliche Kraft, die gut gelaunt und wohlorganisiert – und damit auch nicht ganz billig – ist, wird in ihrem Computer nachschauen (das dauert einen Moment) und sagen: „Herrn Müller finden Sie im dritten Stock, vierte Tür links, Zimmer Nummer 3.14.“ Eine schlecht gelaunte Kraft auf Minijobber-Tarif wird Sie vielleicht angähnen und sagen: „Dritter Stock.“ Ein digitaler Assistent könnte freundlich und in Echtzeit antworten: “Ihren Fall bearbeitet Herr Müller. Er ist im Moment nicht im Büro. Er wird in einer halben Stunde zurück erwartet. Möchten Sie einen Kaffee?” Was bei Maschinen als Zeichen von Intelligenz und kluger Programmierung gesehen wird, könnte bei einem menschlichen Gesprächspartner beinah aufdringlich wirken.

Industrie 4.0

Die Sprach- und Gestensteuerung macht industrielle Prozesse effizienter, produktiver und weniger fehleranfällig. Industrie 4.0 bedeutet intelligente Vernetzung von Entwicklung, Herstellung, Logistik und Kundenprozessen. Sprachschnittstellen und Gesten-Erkennung können diese Vernetzung fördern und viele Aufgaben beschleunigen und erleichtern: Von der Fertigung über die Montage und Wartung bis hin zur Qualitätssicherung. 2 Roboter telefonieren Spracheingabe unterstützt auch die Schulung und Ausbildung von Fachkräften. Denn das Benutzerhandbuch der Zukunft ist ein Chatbot.

Sprachsteuerung im Automotive-Bereich

Klar, wir wissen aus Kindertagen: Knöpfchen drücken KANN auch Spaß machen, vorausgesetzt sie blinken schön und machen lustige Geräusche. Wenn man sich als Erwachsener aber auf der Autobahn wiederfindet und bei der Steuerung seines Fortbewegungsmittels von unzähligen Bedienvorrichtungen angestarrt wird, das mag den einen oder anderen verstören. Tatsache: Manche Automobile haben heutzutage so viele Knöpfe und Schalter wie ein mittlerer Düsenjet. Der Fahrer muss regelmäßig den Blick von der Straße nehmen, wenn er eine Funktion benötigt, die er nicht alle Tage benutzt. Und wenn er wieder aufblickt, ist vielleicht schon ein Reh auf die Straße gelaufen – oder der richtige Augenblick für den Turbo Boost verpasst. Spaß beiseite. Diese gefährliche Fummelei an überladenen Bedienpanels hat hoffentlich bald ein Ende. Der Fahrer der Zukunft wird mit seinem Auto sprechen. Ganz gleich, ob er den Navi nach dem Weg fragt oder die Sitzheizung einschalten möchte.

Sprachsteuerung im digitalen Heim

Bewohner eines “Smart Home” steuern heute schon ihre Spielkonsolen, Haustechnik, Fernseher und Bestellungen per Sprache. Wer morgens etwa nicht weiß, was er anziehen soll (und keinen Partner hat, der es ihm sagt), fragt kurz nach der Wettervorhersage (die übrigens ebenfalls computergeneriert ist).

Sprachsteuerung ermöglicht Inklusion

Die neue Technologie ist mehr als nur eine Spielerei. Sie verschafft Menschen, die durch Krankheit, Alter oder Behinderung eingeschränkt sind, einen ganz neuen Aktionsspielraum. Dagmar ist an den Rollstuhl gefesselt. Sie ist 19 Jahre alt und leidet an Spinaler Muskelatrophie (SMA). Diese Krankheit raubt den Betroffenen allmählich jede Mobilität, bis sie nur noch vom Hals aufwärts beweglich sind. Sprachsteuerung sorgt dafür, dass Dagmar heute Germanistik studieren kann. Sie lässt sich Fachtexte vorlesen und diktiert ihre Hausarbeiten in einen speziell ausgerüsteten Computer. Die Chancen stehen gut, dass Dagmar nach dem Studium einen normalen Beruf ausüben kann.

Fazit

Mensch-Maschine-Interaktion mittels Sprache ist eine Zukunftstechnologie. Was mit Siri begann, findet in digitalen Assistenten und Industrie 4.0 seine logische Fortsetzung. Selbstlernende Sprachanwendungen verstehen die Äußerungen der Benutzer jedes Mal besser. Sie beantworten Fragen kompetenter als mancher Service-Mitarbeiter es könnte. Sprachsteuerung bereichert unser Leben und macht viele Anwendungen einfacher. Sie wird allerdings dazu führen, dass einige niedrig qualifizierte Jobs in Zukunft wegfallen könnten.   Video 1: Scopevisio AG Video 2: danielsangeo Video 3: The Japan Times Video 4: JoelMuehlebach