Intern
MOTIV - Digital Interaction Literacy

Kompetenzen für den selbstbestimmten Umgang mit sprachbasierten KI-Systemen

Sprachassistenten wie Alexa, Siri und Co. haben unseren Umgang mit Technik revolutioniert. Doch wie diese Systeme funktionieren und welche Auswirkungen sie auf unsere Privatsphäre haben, bleibt oft im Dunkeln. Dies führt zu Missverständnissen und Sicherheitsrisiken. Um allen Menschen eine selbstbestimmte Interaktion mit sprachbasierten KI-Systemen zu ermöglichen, müssen bestimmte Kompetenzen durch geeignete Maßnahmen, wie z.B. die MOTIV-Trainingsplattform, gezielt trainiert werden.

Welche Kompetenzen sind für den selbstbestimmten und reflektierten Umgang mit sprachbasierter KI notwendig?

Theoretisch kann jeder sprachbasierte KI-Systeme (KI = Künstliche Intelligenz) wie intelligente Sprachassistenten (z. B. Alexa, Siri) ohne besondere Vorkenntnisse steuern, da grundsätzlich die menschliche Sprache genügt. Um jedoch eine kompetente und vor allem selbstbestimme und reflektierte Nutzung gewährleisten zu können, sind gewisse Grundkenntnisse und Kompetenzen hilfreich. In der Wissenschaft werden dafür erste Konzepte und Rahmenbedingungen formuliert und diskutiert. So entwickelte das Team des Projekts MOTIV (2022) der Universität Würzburg mithilfe von Experteninterviews ein Modell der Digital Interaction Literacy (kurz: DIL). Dieses Modell integriert dabei drei zentrale Oberkategorien, welche für eine kompetente Interaktion zwischen Menschen und sprachbasierten KI-Systemen besonders relevant sind: 1. Verständnis der Funktionsprinzipien, 2. reflektierte Nutzung und 3. nutzergruppenabhängige Kompetenzen. Diese drei Oberkategorien lassen sich wiederum in zehn Subdimensionen unterteilen, welche sowohl Wissen, Kompetenzen als auch Fähigkeiten umfassen. Um welche Kompetenzdimensionen es sich dabei konkret handelt, wird nachfolgend dargestellt.

Oberkategorie 1: Verständnis der Funktionsprinzipien

Für ein Verständnis der Funktionsprinzipien wird Wissen über alle Funktionsabläufe, Datenverarbeitungsmechanismen und Systemeigenschaften von sprachbasierten KI-Systemen benötigt.

Eine kompetente Nutzung von sprachbasierten KI-Systemen setzt ein grundlegendes Verständnis voraus, wie diese Systeme überhaupt funktionieren. Dafür müssen die internen Prozesse für jeden sichtbar und verständlich gemacht werden. Zunächst ist es wichtig zu verstehen, wie die Geräte menschliche Sprache in Form von Sprachbefehlen verarbeiten. Dazu gehört, wie der aufgenommene Sprachbefehl in Daten umgewandelt und diese Daten anschließend verarbeitet und in die Provider-Cloud übertragen werden. Damit ein Sprachassistent jederzeit Sprachbefehle empfangen und darauf reagieren kann, sind die Mikrofone des Geräts dauerhaft aktiv. Das erfordert zusätzlich ein besonderes Bewusstsein im Umgang mit dem Gerät. Zusammenfassend erhöht ein besseres Verständnis der Funktionsweise die Nutzungsbereitschaft und hilft dabei, potenzielle Risiken besser einzuschätzen und damit die Offenlegung sensibler Informationen zu verringern.

Für eine korrekte Handhabung ist es wichtig, über Funktionen und Grenzen sprachbasierter KI-Systeme informiert zu sein und einen richtigen Umgang zu beherrschen. Neben bekannten Funktionen wie die schnelle Informationssuche werden die Geräte beispielsweise auch für die Stimmungsregulation eingesetzt. Sprachassistenten können im Alltag negative Gefühle wie z. B. Einsamkeit lindern und die Stimmung der Nutzenden verbessern. Jedoch können bereits kleine Aussprachefehler dazu führen, dass Sprachbefehle missverstanden oder nicht ausgeführt werden. Es ist also wichtig zu lernen, welche Sprachbefehle funktionieren und mit welchen Eigenarten der menschlichen Sprache (z. B. Sprechpausen, Versprecher oder Metaphern) die Geräte Schwierigkeiten haben. Einige Experten sind sogar der Meinung, dass die derzeitigen Systeme noch nicht weit genug entwickelt sind. So funktionieren die Geräte trotz korrekter Handhabung häufig nicht wie gewünscht, was frustrierend sein kann.

Ein grundlegendes Verständnis der Funktionsweise von Künstlicher Intelligenz (kurz: KI) und maschinellem Lernen setzt zunächst das Wissen voraus, dass jede KI Trainingsdaten benötigt, um auf deren Grundlage Vorhersagen zu treffen. Datenqualität, Feedback oder auch die eigenen Interaktionsdaten haben dabei einen erheblichen Einfluss auf den Trainingsprozess. Sprachassistenten benötigen beispielsweise Feedback, um ein möglichst hohes Maß an personalisierten Antworten und Aktionen zu liefern. Letztlich ist KI immer nur so leistungsfähig wie die Daten, mit denen sie trainiert wurde. Fehlendes Wissen über die grundlegenden Funktionsmechanismen kann falsche Vorstellungen und Erwartungen hervorrufen und dadurch eine kompetente Nutzung beeinträchtigen.

Für einen kompetenten Umgang mit sprachbasierter KI gehört das Bewusstsein, dass Systeme Algorithmen verwenden, um Nutzeranfragen zu verarbeiten. Dabei können unterschiedliche Kontext- und Nutzerinformationen zu gefilterten oder verzerrten Suchergebnissen führen. So ist es möglich, dass verschiedene Personen auf dieselbe Anfrage unterschiedliche Suchergebnisse erhalten. Sprachbasierte KI-Systeme fungieren zudem als eine Art „Torwächter“. Da lediglich eine Antwort der Websuche vorgelesen wird, entscheidet das System, welche Informationen weitergegeben werden und welche nicht. Hinzu kommt, dass Menschen Informationen von Sprachassistenten glaubwürdiger einstufen als Ergebnissen einer klassischen Suchanfrage über Suchmaschinen. Aus diesem Grund ist es besonders wichtig, die gelieferten Informationen und deren Glaubwürdigkeit kritisch zu hinterfragen. Ein Bewusstsein für Algorithmen schützt davor systemgenerierten Informationen ausgeliefert zu sein und hat zudem einen erheblichen Einfluss auf Datenschutzbedenken.

Oberkategorie 2: Reflektierte Nutzung

Eine reflektierte Nutzung von sprachbasierten KI-Systemen umfasst die Fähigkeit, Interaktionen zu planen, Nutzungsziele zu erreichen und Probleme bei der Gerätenutzung zu reduzieren. Aber auch die Kompetenz, das eigene Nutzungsverhalten zu hinterfragen, es an die eigenen Bedürfnisse anzupassen und unerwünschte Nutzungserfahrungen zu vermeiden, ist Bestandteil einer reflektierten Nutzung.

Wichtige Voraussetzungen für eine sichere Interaktion mit sprachbasierter KI stellen das Erkennen potenzieller Risiken für die Privatsphäre sowie das Verwalten und Schützen der eigenen Daten dar. Zu den potenziellen Sicherheitsrisiken zählen beispielsweise gängige Praktiken der Anbieter hinsichtlich des Teilens und Verarbeitens von Daten sowie die daraus resultierenden Konsequenzen für die Nutzenden. Ein weiteres potenzielles Risiko besteht darin, dass Sprachassistenten versehentlich aktiviert werden und dadurch unerwünschte Sprachaufzeichnungen an die Provider-Clouds gelangen können. Um diesen Risiken entgegenzuwirken, sollten sich Nutzende über konkrete Maßnahmen zum Schutz der Privatsphäre informieren wie beispielsweise das Deaktivieren geräteinterner Einstellungen. Dafür ist neben dem Erkennen von möglichen Gefahren zusätzlich das Wissen wichtig, welche Daten überhaupt ein mögliches Sicherheitsrisiko bergen. Aufgrund unzureichender Informationen stellt das für viele Menschen eine Herausforderung dar. Hinzu kommt, dass Datenschutzbedenken häufig heruntergespielt und private Daten offengelegt werden, um von den Vorteilen der Geräte stärker zu profitieren.

Menschenähnliche Merkmale von sprachbasierten KI-Systemen können die Wahrnehmung und das Verhalten von Menschen unbewusst beeinflussen oder gar manipulieren. Für eine kompetente Nutzung ist daher die Fähigkeit zur Erkennung und Verhinderung einer möglichen Beeinflussung notwendig. Anthropomorphe Merkmale (z. B. Sprachfähigkeit) von Geräten lassen diese menschenähnlich erscheinen. Dadurch reagieren Menschen sozial auf sie und nehmen sie als vertrauenswürdig und kompetent wahr. Diese automatische Reaktion kann unterschiedliche Folgen haben. Zum einen geben Personen tendenziell mehr persönliche Daten über sich preis. Zum anderen kann das dadurch erzeugte Vertrauen für kommerzielle Zwecke ausgenutzt werden. Käufe über Sprachassistenten werden nicht nur als bequemer und niedrigschwelliger wahrgenommen, sondern verleiten auch zu unbedachten und impulsiven Kaufentscheidungen. Zukünftige Entwicklungen gehen sogar noch weiter. Amazon hat beispielsweise ein Patent eingereicht, das körperliche (z. B. Husten) und emotionale Zustände (z. B. Müdigkeit) auf der Grundlage der Stimme der Nutzenden analysiert. Basierend auf den dadurch gelieferten Hinweisen bieten die Systeme beiläufige Empfehlungen und Produktvorschläge an, was das Kaufverhalten beeinflussen kann.

Während der Interaktion mit sprachbasierten KI-Systemen können negative Emotionen (z. B. Angst oder Frustration) auftreten. Ein konstruktiver Umgang mit diesen Emotionen ist wichtig, um unrealistische Ängste zu erkennen und abzubauen sowie realistische Vorstellungen über die Geräte zu entwickeln. Negative Emotionen beeinflussen nämlich nicht nur die Interaktion generell, sondern führen auch zu einer Nicht-Nutzung und einem Unverständnis von Technologien. Frustration erleben Personen z. B. dann, wenn ein Sprachbefehl nicht richtig verstanden wird oder Erwartungen an das Gerät nicht erfüllt werden. Angst kann in diesem Kontext verschiedene Auslöser haben. Beispielsweise Sorgen über den Schutz der eigenen Privatsphäre, die unerlaubten Zugriffe durch Dritte oder die Künstliche Intelligenz generell. Aber auch Angst vor sozialer Ausgrenzung, wenn eine neue Technologie nicht genutzt wird, spielt häufig eine Rolle.

Zu einer kompetenten Interaktion mit sprachbasierten KI-Systemen gehört auch das eigene Verhalten reflektieren, bewerten und interpretieren zu können. Dabei sollten sowohl die eigenen Bedürfnisse als auch ethische Aspekte und Risiken berücksichtigt werden. Die Reflexion des eigenen Nutzungsverhaltens ist einerseits wichtig, um die zukünftige Nutzung entsprechend der eigenen Bedürfnisse anzupassen sowie andererseits, um zu entscheiden, welche Daten eine Person wirklich mit dem Anbieter teilen möchte. Zudem kann das Nachdenken über die Wirkung anthropomorpher Technologien dabei helfen, das Auslösen bestimmter automatischer Nutzerreaktionen besser zu kontrollieren.

Oberkategorie 3: Nutzergruppenabhängige Kompetenzen

Nutzergruppenabhängige Kompetenzen umfassen Fähigkeiten und Fertigkeiten, die lediglich für bestimmte Nutzergruppen in Abhängigkeit von persönlichen Präferenzen und Verantwortlichkeiten bedeutsam sind.

Für bestimmte Nutzergruppen und Anwendungsbereiche sind Programmierkenntnisse von Vorteil. Sie sind beispielsweise hilfreich, um Fähigkeiten von Sprachassistenten zu entwickeln oder Gerätefunktionen an die individuellen Bedürfnisse der Nutzenden anzupassen. Für die alltägliche Interaktion mit KI sind Programmierkenntnisse jedoch nicht erforderlich. Das Wissen über die grundlegenden Funktionsweisen von KI-Systemen und Algorithmen ist für einen kompetenten Umgang deutlich wichtiger.

Für Kinder und Jugendliche stellen enge Bezugspersonen eine wichtige Informationsquelle hinsichtlich der Nutzung von Technologien dar. Deswegen ist es besonders wichtig, dass Eltern, Pädagogen oder andere betreuende Personen in der Lage sind, Wissen über sprachbasierte KI-Systeme verständlich zu vermitteln sowie das Nutzungsverhalten von Kindern und Jugendlichen zu beobachten und pädagogisch zu bewerten. Eine frühe Förderung der Technologieaffinität durch Bezugspersonen, sei es in der Schule oder zuhause, kann für Kinder viele Vorteile haben. Zum einen wirkt sie sich positiv auf das Verständnis der Gerätefunktionen, die Entwicklung realistischer Erwartungen und ein höheres Maß an Motivation aus. Zum anderen führt eine höhere Technologieaffinität zu weniger Problemen während der Interaktion mit sprachbasierten KI-Systemen.