Wie funktioniert Künstliche Intelligenz?
„Alexa, starte die Waschmaschine“, „Siri, was ist der schnellste Weg nach Barcelona“, „Hey Google, mach mir einen Termin beim Orthopäden aus“. Künstliche Intelligenz (KI) beginnt uns mehr und mehr im Alltag zu begleiten, aber sie steckt nicht nur in den Geräten, mit denen wir sprechen, sondern in den verschiedensten Technologien unseres täglichen Lebens. So finden wir KI zum Beispiel in Übersetzungstools, Suchmaschinen, Bildanalysesoftwares, Gesichtserkennungssystemen oder Autos. Künstliche Intelligenz gilt als "zukunftsweisende Technologie", die schon jetzt unseren Alltag beeinflusst und künftig noch stärker verändern kann. Doch was versteht man eigentlich genau unter Künstlicher Intelligenz und wie „lernt“ sie?
Was ist Künstliche Intelligenz?
Künstliche Intelligenz (KI) umfasst Maschinen und Computersysteme, die menschenähnliche Aufgaben ausführen und Entscheidungen treffen können. KI nutzt Algorithmen und komplexe mathematische Modelle zur Datenanalyse und Mustererkennung. Ein Smart Speaker nutzt beispielsweise KI-Technologien zur natürlichen Spracherkennung und -verarbeitung. Dies ermöglicht es dem Gerät, menschliche Stimmen zu verstehen und zu interpretieren, Fragen zu beantworten und Befehle auszuführen.
Die Fähigkeiten von KI lassen sich in zwei Kategorien aufteilen: schwache und starke KI. Schwache KI bezieht sich auf spezialisierte Systeme, die auf eine bestimmte Aufgabe oder ein bestimmtes Problem beschränkt sind, wie z.B. Bilderkennung oder Spracherkennung. Starke KI wiederum, wäre in der Lage komplexere und zusammenhängende Probleme und Entscheidungen zu bewältigen, die menschliche Intelligenz erfordern. Bisher gibt es aber keine starke KI, die über menschenähnliche kognitive Fähigkeiten verfügt sowie selbstständig handelt. Derzeitige KI-Systeme sind für die Durchführung spezifischer Aufgaben schon sehr nützlich, kommen aber nicht an die Intelligenz und das Bewusstsein eines Menschen heran. Starke KI ist aktuell noch eine Zukunftsvision und es wird diskutiert, ob die Entwicklung einer starken KI überhaupt möglich ist.
Es gibt eine Vielzahl von KI-Anwendungen, die bereits heute im Alltag eingesetzt werden. Zum Beispiel können personalisierte Empfehlungen von Streaming-Diensten oder Online-Shops auf der Analyse von Nutzungsdaten und KI-Algorithmen basieren. Im Bereich der Mobilität tragen selbstfahrende Autos, die mithilfe von KI und Sensortechnologie navigieren, zur Reduzierung von Unfällen bei. In der Medizin werden Ärzte von KI in der Diagnostik von Krankheiten unterstützt, womit Behandlungen verbessert werden können. Chatbots und Sprachassistenten wie Siri und Alexa nutzen KI, um natürlichere Gespräche zu führen und Nutzeranfragen effizient zu bearbeiten. Die Liste der KI-Anwendungen im Alltag ist lang und wird voraussichtlich in Zukunft noch weiterwachsen.
Was ist Maschinelles Lernen?
Das Maschinelle Lernen (ML) bzw. Machine Learning stellt ein Teilgebiet der Künstlichen Intelligenz dar, die sich mit dem selbstständigen Erschließen von Zusammenhängen auf Basis von Beispieldaten beschäftigt. ML ermöglicht es KI-Systemen, aus Daten eigenständig zu lernen und Probleme zu lösen, ohne dass diese explizit mit Regeln programmiert werden müssen. Maschinelles Lernen ist ein wertvolles Werkzeug in verschiedenen Anwendungsbereichen. ML kann relevante Daten finden und analysieren, Vorhersagen treffen und Wahrscheinlichkeiten berechnen. Besonders gut eignet sich Maschinelles Lernen für die Erkennung, sowie Generierung sogenannter „Mustern“ aus vorliegenden Datensätzen.
Ein Beispiel für das Erkennen von Mustern könnte so aussehen: Stellen wir uns vor, wir entwickeln ein Programm, welches abgebildete Tiere auf Bildern identifizieren kann. Zunächst werden dem Programm viele Bilder von Tieren, wie Hunde, Katzen, Elefanten und Löwen gezeigt. Es lernt, welche Merkmale es suchen muss, um zu erkennen, welches Tier ein Bild zeigt. Sobald es dies erlernt hat, kann es auf neue Bilder angewendet werden, die es noch nie zuvor gesehen hat und dabei einordnen, welches der bekannten Tiere das Bild zeigt.
Anders als bei der Musterkennung, werden bei der Mustergenerierung gelernte Muster genutzt, um selbst bspw. ein Bild von einem Tier zu erstellen. Anhand eines Datensatzes lernt ein Programm, welche Farben und Formen es verwenden muss, um zum Beispiel ein Pferdebild zu malen. Sobald es dies gelernt hat, kann es neue Bilder von Pferden erstellen, die es noch nie zuvor gesehen hat.
Die Erkennung und Generierung von Mustern sind auch für Smart Speaker von großer Relevanz. Beispielsweise kann die Musterkennung genutzt werden, um den Benutzer zu verstehen oder anhand seiner Stimme zu erkennen sowie personalisierte Dienste anzubieten. Die Mustergenerierung wiederum kann genutzt werden, um den Smart Speaker menschenähnliche Sprache generieren zu lassen, wodurch eine Kommunikation zwischen Gerät und Mensch möglich wird.
Wie lernt eine Maschine?
Wenn beispielsweise eine KI mittels Machine Learning lernen soll, auf Bildern Katzen zu erkennen, müssen Menschen dem System zunächst Bilder mit und ohne Katzen präsentieren, damit die KI selbstständig lernen kann, welche Merkmale eine Katze auszeichnen. Auf diese Weise lernt die KI Katzen richtig zu klassifizieren und automatisch zu erkennen. Dieser Prozess wird auch „Training“ genannt, wofür unterschiedliche Lerntechniken angewendet werden können.
Machine Learning-basierte KI wird häufig nach einer, der drei folgenden Paradigmen trainiert:
Überwachtes Lernen (Supervised Learning): Im Überwachten Lernen trainieren Menschen einen Algorithmus, indem sie ihm manuell gekennzeichnete Trainingsdaten zur Verfügung stellen. So können Menschen dem Algorithmus zunächst sagen, bei welchen Bildern es sich um eine Katze oder keine Katze handelt, wodurch nach mehreren Durchläufen eine Gesetzmäßigkeit erkannt und ein Neuronales Netz antrainiert wird. Durch das ständige Üben und Feedback lernt der Algorithmus, welche Eingaben zu welchen Ausgaben führen und lernt das zugrunde liegende Muster. Somit kann er künftig selbstständig arbeiten und neue Daten in die richtige Kategorie einordnen.
Ein praktisches Beispiel für das Überwachte Lernen bei Sprachassistenten, ist die Implementierung von "Wake Words". Hierbei wird das Modell anhand einer großen Anzahl an Audioaufnahmen trainiert, die teilweise das Wake Word enthalten, bis es in der Lage ist, es korrekt zu erkennen und den Sprachassistenten zu aktivieren.
Im Falle von Sprachassistenten ist bereits bekannt, dass bei Anbietern wie Google oder Amazon, Menschen zur Bewertung anonymisierter Sprachaufnahmen eingesetzt werden. Hierbei werden die Daten durch Mitarbeiter analysiert und manuell gekennzeichnet, um sicherzustellen, dass der Sprachassistenten Sprachanfragen korrekt verarbeitet. Diese Bewertungen werden dann für das maschinelle Lernen verwendet, um das Modell des Sprachassistenten zu verbessern und weiter zu trainieren.
Unüberwachtes Lernen (Unsupervised Learning): Während beim Überwachten Lernen menschlicher Eingriff notwendig ist, erkennt die KI beim Unüberwachten Lernen Muster und Ähnlichkeiten zwischen den Daten selbstständig. Unsupervised Learning wird oft angewendet, wenn die Struktur der Daten unbekannt ist. Im Gegensatz zum Supervised Learning sind dem Algorithmus keine manuell gekennzeichneten Trainingsdaten oder Zielkategorien bekannt. Der Algorithmus lernt, Muster in den Daten selbstständig zu erkennen und diese intern in eine für sich in eine sinnvolle Repräsentation zu überführen. Da jedoch kein konkretes Ziel vorhanden ist, ist es schwierig, die Richtigkeit der Ergebnisse zu bewerten und die Relevanz der generierten Muster zu beurteilen. Da das Unüberwachte Lernen große Datenmengen benötigt, wird es häufig mit dem Überwachten Lernen kombiniert wird – das sogenannte Halb-überwachte Lernen.
Halb-überwachtes Lernen (Semi-Supervised Learning): Bei dieser Lerntechnik wird ein Algorithmus sowohl mit Daten trainiert, die sowohl manuell gekennzeichnet als auch nicht beschriftet sind. Ein Beispiel für das Halb-überwachte Lernen bei Sprachassistenten ist die Verwendung von Nutzerdaten, um das Verständnis von Sprache zu verbessern. Das Modell wird zunächst auf eine große Menge an nicht gekennzeichneten Daten aus Sprachaufzeichnungen trainiert, die durch Interaktionen mit dem Sprachassistenten gesammelt werden. Hierdurch erhält es ein allgemeines Verständnis von Sprache. Anschließend wird das Modell anhand einer kleineren Menge von bereits manuell gekennzeichneten Daten feinabgestimmt, um seine Fähigkeiten zu verbessern.
Wovon hängt die Lernleistung von KI ab?
Wir haben also erfahren, dass KI-Technologien unterschiedliche Lerntechniken nutzen, um ihre Fähigkeiten immer weiter zu verbessern. Wie gut dies funktioniert, hängt aber auch von weiteren Faktoren ab, die die Lernleistung der KI beeinflussen. Ein gutes Beispiel hierfür sind Sprachassistenten.
Sprachassistenten verwenden eine Vielzahl von KI-Technologien aus dem Bereich des Natural Language Processing, um natürliche Sprache zu verstehen, zu verarbeiten und darauf zu reagieren. Zu den wichtigsten machine learning-basierten KI-Technologien, die in Sprachassistenten eingesetzt werden, gehören:
- Automatic Speech Recognition (ASR) bzw. Speech-to-Text (STT). Hierbei werden mithilfe von KI-Technologien gesprochene Sprache und Wörter erkannt und in Text umgewandelt. Der Sprachassistent erkennt somit, was der Nutzende sagt.
- Natural Language Understanding (NLU). Hierbei werden die Bedeutung und der Kontext von Wörtern und Sätzen analysiert, um zu verstehen, was der Nutzende meint/möchte (Intent).
- Text-to-Speech (TTS) oder die Sprachsynthese: Hierbei wird Text in Sprache umgewandelt, damit der Sprachassistent Antworten in natürlicher Sprache geben kann.
Damit Sprachassistenten gut funktionieren und sich weiterentwickeln können, müssen sie trainiert werden und dazulernen. Die Leistung von Sprachassistenten, die mit Hilfe von maschinellem Lernen Anfragen von Nutzern verarbeiten sollen, hängt unter anderem von den Trainingsprozessen selbst ab. Eine zuverlässige Spracherkennung und -verarbeitung in einem Smart Speaker Sprachassistenten hängt maßgeblich von der Verfügbarkeit von Daten und Feedback ab. Eine hohe Datenmenge und regelmäßiges Feedback sind unerlässlich, um eine qualitativ hochwertige KI zu gewährleisten. Es ist jedoch wichtig zu beachten, dass die Qualität der Ergebnisse nur so gut sind wie die Daten, mit denen sie trainiert wurden.
Ein Beispiel hier wäre, wenn Sprachassistenten nur auf einer begrenzten Datenmenge trainiert wurden. Infolgedessen können Sprachassistenten Probleme damit haben bestimmte Akzente zu verstehen. Dies liegt daran, dass die Datenmenge, mit der das System trainiert wurde, nicht ausreichend war, um eine ausreichende Vielfalt an Akzenten und Sprachvariationen abzudecken. Daher ist es wichtig, Sprachassistenten auf einer großen und vielfältigen Datenmenge zu trainieren, um eine hohe Leistung und Zuverlässigkeit zu gewährleisten.
Große und diverse Datenmengen sind demnach für das Maschinelle Lernen sehr wichtig. Jede Interaktion und jedes Feedback an die Geräte trägt dazu bei, die Qualität verbessern zu können. Die Entwicklung von KI-Anwendungen hat in den letzten Jahren durch die steigende Verfügbarkeit großer Datenmengen und hoher Rechenleistung erhebliche Fortschritte gemacht. Dies wurde durch die wachsende Anzahl digitaler Datenquellen wie sozialer Medien, Sensoren und Sprachassistenten sowie die erhöhte Bereitstellung öffentlicher Datensätze von Regierungen und Wissenschaftlern ermöglicht. So können Entwickler größere und umfassendere Datensätze nutzen, um zugrundliegende Modelle der KI-Technologien effektiver zu trainieren und zu verbessern.
Je mehr Interaktion mit Sprachassistenten stattfinden und je mehr Feedback sie erhalten, umso besser können die KI-basierten Systeme in Zukunft werden. Jeder Nutzer kann durch die Interaktionen mit den Geräten sowie das direkte Feedback an diese dazu beitragen. Wenn du z.B. Alexa nach dem Wetter in Würzburg fragst, aber eine unpassende Antwort erhältst, wie z.B. „Das Wetter ist wie ein Stück Schokolade - manchmal heiß und schmelzend, manchmal kalt und hart. Aber immer lecker!“, könntest du direkt zurückmelden: "Alexa, das war nicht hilfreich!". Das Feedback wird dann überprüft und genutzt, um das System zu verbessern. In diesem Fall würde der Sprachassistent das Feedback an Amazon zurückmelden. Und je häufiger Interaktionen wie diese stattfinden und Rückmeldungen in diesem Bereich erfolgen, desto wahrscheinlich ist es, dass Sprachassistenten in Zukunft passendere und sinnvollere Antworten liefern.