“Das klingt nach ChatGPT”

15. Juni

Verfasst von Rami Ali

Über den neuen Echtheitsverdacht gegen migrantische Expertise

Vor ein paar Wochen kritisierte ich eine Studie. Nicht polemisch, nicht nebenbei, nicht aus Bauchgefühl. Ich schrieb über Forschungsdesign, Begriffe, Schlussfolgerungen. Ich fragte, ob die Daten wirklich das tragen, was aus ihnen gemacht wurde. Eine gewöhnliche methodische Kritik also, wie ich sie seit Jahren formuliere. Seit 2016, 2017 ungefähr, lange bevor ChatGPT in jedem zweiten Kommentarspalt als Verdachtsmaschine herumstand.

Die Antwort des Studienautors ging nicht auf die Kritik ein. Sie zielte auf den Text als Text. Ich hätte das wohl mit KI geschrieben, meinte er sinngemäß, um meiner Kritik Gewicht zu verleihen.

Das war praktisch. Die Studie musste nicht verteidigt werden. Die Begriffe mussten nicht erklärt werden. Die Interpretation musste nicht begründet werden. Plötzlich saß nicht mehr die Studie auf der Prüfbank, sondern meine Autorschaft.

Seit generative KI öffentlich verfügbar ist, hat sich eine neue kleine Waffe in akademische, politische und publizistische Auseinandersetzungen geschoben. Sie liegt griffbereit, braucht kaum Vorbereitung und beschädigt sofort. „Das klingt nach ChatGPT.“ Mehr muss man oft nicht sagen. Der Satz ist kein Argument. Er ist ein Verdacht, der sich als Medienkompetenz verkleidet.

Für manche ist dieser Verdacht lästig. Für andere ist er gefährlicher. Wer ohnehin als kompetent, gebildet, sachlich und selbstverständlich zugehörig gelesen wird, übersteht eine solche Bemerkung leichter. Bei migrantischen, Schwarzen, muslimischen oder weiblichen Stimmen trifft sie auf eine ältere Geschichte. Da war der Zweifel schon vorher da. Die KI-Unterstellung gibt ihm nur eine neue Oberfläche.

Man muss sich die alte Grammatik dieser Zweifel anschauen. Schwarze Menschen sprechen über Rassismus und gelten als zu betroffen. Frauen kritisieren Sexismus und gelten als emotional. Musliminnen und Muslime äußern sich zu Islamismus, Sicherheitspolitik oder antimuslimischem Rassismus und geraten in Loyalitätsprüfungen. Migrantische Akademiker schreiben präzise, und plötzlich interessiert sich jemand dafür, ob ihnen diese Präzision überhaupt zuzutrauen ist.

Der Verdacht lautet selten offen: Jemand wie du kann das nicht geschrieben haben. So plump tritt er meist nicht mehr auf. Er kommt höflicher, technischer, gegenwartsfähiger daher. Er sagt: In Zeiten von KI muss man eben vorsichtig sein.

Vorsicht kann berechtigt sein. Es gibt maschinell produzierte Texte, Ghostwriting, Täuschung, akademische Faulheit und den billigen Versuch, Verantwortung an Software auszulagern. Niemand, der ernsthaft schreibt, muss so tun, als sei das kein Problem. Aber ein legitimes Problem kann auf unlautere Weise benutzt werden. Genau darum geht es hier.

Der KI-Verdacht wird dort zum Machtmittel, wo er nicht der Klärung dient, sondern der Abwehr. Wo er nicht gestellt wird, weil es Hinweise gibt, sondern weil eine Kritik zu gut sitzt. Wo er nicht nach Arbeitsweise fragt, sondern die Person hinter dem Text beschädigt. Wo er auftaucht, sobald eine Stimme präziser, kälter, methodischer oder sprachlich souveräner klingt, als man es ihr zugestehen möchte.

Der Angriff ist klein, aber er verschiebt viel. Aus einer Kritik wird ein Output. Aus einem Autor wird ein Nutzer. Aus einer argumentierenden Person wird jemand, der angeblich fremde Intelligenz vor sich herschiebt.

Das ist für rassifizierte Sprecherinnen und Sprecher keine neue Erfahrung. Neu ist nur das technische Vokabular. Die Zumutung selbst ist älter: Du sprichst, aber dein Sprechen zählt nicht vollständig. Du schreibst, aber deine Autorschaft bleibt verdächtig. Du bringst Wissen ein, aber zuerst wird geprüft, ob du als Träger dieses Wissens überhaupt infrage kommst.

Miranda Fricker hat dafür den Begriff der epistemischen Ungerechtigkeit geprägt. Menschen können nicht nur ökonomisch, rechtlich oder politisch benachteiligt werden, sondern auch in ihrer Rolle als Wissende. Eine Person sagt etwas Begründetes, aber Vorurteile sorgen dafür, dass ihr weniger Glaubwürdigkeit zugestanden wird. Fricker nennt das testimonial injustice: ein Glaubwürdigkeitsentzug, der nicht aus der Sache kommt, sondern aus dem sozialen Blick auf die Person.

Der KI-Verdacht passt in dieses Muster, verschärft es aber an einer bestimmten Stelle. Die ältere Herabsetzung sagte: Du bist zu betroffen, zu emotional, zu parteiisch, zu nah dran. Die neue Herabsetzung sagt: Du bist vielleicht gar nicht der Ursprung dieses Gedankens.

Das ist ein anderer Zugriff. Wer als parteiisch gilt, bleibt wenigstens noch Sprecher. Wer als bloße Schnittstelle einer Maschine gelesen wird, verliert mehr. Ihm wird die Arbeit am Gedanken entzogen. Die Lektüre, die Erfahrung, die Routine, der Ärger, die methodische Schulung, das jahrelange Schreiben – alles wird aus dem Bild gedrängt. Übrig bleibt ein Prompt.

Gerade deshalb ist der Satz so wirksam. Er muss nicht beweisen, dass ein Text maschinell erzeugt wurde. Er muss nur Unsicherheit stiften. Danach muss die betroffene Person erklären, wie sie geschrieben hat. Welche Quellen sie gelesen hat. Ob sie Notizen hat. Ob frühere Texte ähnlich klingen. Ob sie schon vor 2022 so formuliert hat. Die Sache rutscht weg. Die Person muss ihre Echtheit verwalten.

Ich kenne diese Logik aus anderen Debatten. Wer als Muslim über antimuslimischen Rassismus spricht, muss oft zuerst beweisen, dass er nicht verharmlost. Wer über Islamismus spricht, muss beweisen, dass er nicht aus falscher Loyalität schweigt. Wer migrantische Perspektiven in die Sicherheitsdebatte einbringt, wird schnell zum Fall, nicht zum Gesprächspartner. Die eigene Position wird nicht als Wissensressource gelesen, sondern als Kontaminierung.

Die KI-Unterstellung erweitert dieses Repertoire. Sie gibt Menschen, die mit Kritik schlecht umgehen können, einen eleganten Seitenausgang. Studienautorinnen, Behördenvertreter, politische Akteure, Journalisten, NGO-Leitungen, wissenschaftliche Milieus: Überall dort, wo Status geschützt wird, kann der Verdacht nützlich werden. Man muss nicht sagen, dass einen die Kritik getroffen hat. Man kann sagen, sie sei vermutlich technisch aufgeblasen.

An dieser Stelle wird der Blick auf KI-Detektoren wichtig, aber nicht aus dem Grund, den viele vermuten. Die entscheidende Frage ist nicht, ob ein bestimmter Detektor in einem bestimmten Fall richtig oder falsch liegt. Die wichtigere Frage lautet, weshalb eine technisch unsichere Praxis mit so viel sozialer Gewissheit auftritt.

Die Forschung ist vorsichtig genug, um Alarm auszulösen. Liang und Kolleginnen zeigten 2023, dass mehrere verbreitete GPT-Detektoren Texte nicht-muttersprachlicher englischer Schreibender auffällig häufig fälschlich als KI-generiert einstuften. OpenAI selbst beschrieb den eigenen AI Text Classifier als nicht vollständig zuverlässig und wies auf Probleme bei kurzen Texten, nicht-englischen Texten und falschen positiven Ergebnissen hin. Turnitin warnt in den eigenen Materialien vor Fehlinterpretationen und blendet niedrige AI-Scores unterhalb einer Schwelle nicht mehr als konkrete Prozentwerte aus, um falsche positive Lesarten zu vermeiden.

Das heißt nicht, dass jede Erkennung unmöglich ist. Es heißt auch nicht, dass jeder Verdacht böswillig ist. Es heißt nur: Wer auf dieser Grundlage eine Person öffentlich oder halböffentlich der unechten Autorschaft verdächtigt, bewegt sich nicht auf festem Boden. Ein schwerer Vorwurf braucht mehr als Stilgefühl, gekränkte Autorität oder ein Tool, dessen Ergebnis viele selbst nicht erklären können.

Im Alltag braucht es aber oft gar kein Tool. Der Satz „Das klingt nach KI“ reicht. Er ist schnell, vage und schwer zu greifen. Man kann ihn immer zurücknehmen: War ja nur ein Eindruck. Man kann ihn streuen, ohne Verantwortung zu übernehmen. Man kann ihn hinter verschlossenen Türen wiederholen, bis aus einem Autor jemand wird, über den man „gehört hat“, dass er seine Texte wohl nicht selbst schreibt.

So funktionieren viele Delegitimierungen. Sie müssen nicht juristisch belastbar sein. Sie müssen sozial kleben.

Der Verdacht trifft besonders dort, wo Sprache ohnehin als Prüfzone dient. Rassifizierte Personen werden nicht nur danach beurteilt, was sie sagen. Sie werden danach beurteilt, ob die Form ihres Sprechens zu dem Bild passt, das andere von ihnen haben. Nelson Flores und Jonathan Rosa beschreiben mit dem Begriff der raciolinguistic ideologies, wie rassifizierte Sprecher selbst dann als sprachlich defizitär gelesen werden können, wenn sie die erwarteten Standards erfüllen. Der Fehler liegt dann nicht im Satz. Er liegt im Ohr, das ihn hört, oder im Auge, das ihn liest.

Für migrantische Schreibende entsteht daraus ein enger Korridor. Schreibst du mit Brüchen, heißt es: unsauber. Schreibst du präzise, heißt es: verdächtig. Schreibst du persönlich, heißt es: betroffen. Schreibst du distanziert, heißt es: nicht authentisch. Schreibst du akademisch, heißt es: wahrscheinlich KI.

Man soll also zugleich fehlerfrei und nicht zu fehlerfrei sein. Gebildet, aber nicht so gebildet, dass es irritiert. Persönlich, aber nicht betroffen. Kritisch, aber nicht verletzend. Dankbar sichtbar, aber nicht zu laut.

Wer diesen Korridor nicht akzeptiert, löst Sanktionen aus. Manchmal offen, manchmal beiläufig. Ein Nebensatz reicht. Eine Andeutung. Ein Witz über ChatGPT. Eine Bemerkung im Kollegenkreis.

Die KI-Debatte wird oft so geführt, als stünden auf der einen Seite naive Technikbegeisterung und auf der anderen Seite skeptische Integrität. Das ist zu schlicht. Natürlich müssen Institutionen klären, wie sie mit generativer KI umgehen. Aber dieselben Institutionen müssen auch klären, wie sie mit dem Verdacht umgehen. Ein falscher Betrugsvorwurf ist kein Kollateralschaden einer notwendigen Kontrolle. Er kann Karrieren beschädigen, Schüler demütigen, Studierende unter Druck setzen, migrantische Autorität schwächen und öffentliche Kritik entwerten.

Wer Integrität schützen will, darf nicht mit raunender Verdachtskommunikation arbeiten.

Das gilt besonders in wissenschaftlichen Konflikten. Methodische Kritik ist unbequem, weil sie nicht nur Meinungen angreift, sondern Verfahren. Sie fragt nach Stichproben, Kategorien, Operationalisierung, Auswertung, Interpretationsspielräumen. Sie zwingt Autorinnen und Autoren, die eigene Arbeit noch einmal von außen zu sehen. Genau deshalb ist die Versuchung groß, auf die Person auszuweichen.

Wenn dann der KI-Verdacht kommt, erkennt man die Abwehrbewegung ziemlich gut. Sie sagt nicht: Die Kritik an unserer Operationalisierung ist falsch, weil ... Sie sagt: Dieser Text wirkt nicht echt. Damit wird die Zumutung zurückgeschoben. Nicht die Studie muss sich erklären, sondern der Kritiker.

In dieser Verschiebung liegt das politische Problem. Sie verändert, wer im Diskurs Arbeit leisten muss. Die einen veröffentlichen, setzen Begriffe, rahmen Felder, vergeben Deutung. Die anderen müssen erst beweisen, dass sie überhaupt qualifiziert, neutral, echt und eigenständig genug sind, um diese Deutung zu kritisieren.

Für diesen Mechanismus schlage ich den Begriff algorithmischer Echtheitsverdacht vor.

Algorithmisch ist der Verdacht nicht deshalb, weil immer ein Algorithmus beteiligt wäre. Oft reicht ein sozialer Reflex. Algorithmisch ist er, weil er seine Plausibilität aus einer Gegenwart bezieht, in der maschinelle Textproduktion als ständiger Hintergrundverdacht existiert. Echtheitsverdacht ist er, weil nicht zuerst die Aussage geprüft wird, sondern die Person als Ursprung dieser Aussage.

Der Begriff hilft, zwei Dinge auseinanderzuhalten. Es gibt berechtigte Fragen nach Autorschaft, Transparenz und Täuschung. Und es gibt eine Praxis, in der solche Fragen selektiv gegen Personen eingesetzt werden, deren Stimme ohnehin prekär gemacht wird. Der gleiche Satz kann in verschiedenen Machtverhältnissen Unterschiedliches tun.

Deshalb reicht es nicht, über Detektoren, Tools und KI-Regeln zu sprechen. Man muss über soziale Lesepraxen sprechen. Wer wird schnell verdächtigt? Wem glaubt man komplexe Sätze? Wessen Fehler gelten als individuelle Nachlässigkeit, wessen Fehler als Gruppenmerkmal? Wessen Präzision gilt als Bildung, wessen Präzision als technische Maske?

Safiya Umoja Noble hat an Suchmaschinen gezeigt, dass algorithmische Systeme gesellschaftliche Machtverhältnisse nicht einfach neutral ordnen. Ruha Benjamin beschreibt, wie technische Systeme alte Hierarchien in moderner Form fortsetzen können. Mein Punkt liegt etwas anders, aber in derselben Nachbarschaft: Nicht nur Systeme können diskriminieren. Auch Menschen benutzen den Verweis auf Systeme, um alte Diskriminierung plausibler zu machen.

Die Maschine schreibt dann vielleicht gar nichts. Sie muss nur als Verdacht verfügbar sein.

Was folgt daraus für eine anständige Praxis?

Erstens: Wer KI-Nutzung unterstellt, soll den Vorwurf aussprechen wie einen Vorwurf, nicht wie eine Laune. Mit Kriterien. Mit Kontext. Mit der Bereitschaft, sich zu irren. Wer das nicht leisten will, sollte schweigen.

Zweitens: Eine Kritik bleibt eine Kritik, auch wenn sie mit Hilfsmitteln entstanden sein sollte. Ein Textverarbeitungsprogramm, ein Lektorat, ein Gespräch mit Kolleginnen, eine Übersetzungshilfe, ein KI-System: All das kann an Textproduktion beteiligt sein. Die Frage ist, wer für Auswahl, Urteil, Argument und Verantwortung einsteht. Wer eine methodische Kritik erhält, muss sie beantworten oder offen sagen, dass er sie nicht beantworten kann.

Drittens: Institutionen müssen aufhören, Detektion mit Gewissheit zu verwechseln. Gerade dort, wo Sanktionen drohen, braucht es Verfahren, die Menschen schützen: Gespräch, Schreibprozess, Entwürfe, Quellenarbeit, fachliche Prüfung. Ein Score ersetzt kein Urteil.

Viertens: Marginalisierte Sprecherinnen und Sprecher dürfen nicht in eine Authentizitätsfalle gedrängt werden. Niemand sollte absichtlich holpriger schreiben müssen, um glaubwürdig zu wirken. Niemand sollte seine Bildung verstecken, damit sie nicht verdächtig aussieht. Niemand sollte seine Kritik mit biografischen Belegen absichern müssen, bevor sie als Kritik gelesen wird.

Der Satz „Das klingt nach ChatGPT“ wird bleiben. Er wird in Schulen, Universitäten, Redaktionen, Kommentarspalten und politischen Milieus weiter herumgereicht werden. Manchmal berechtigt. Oft bequem. Entscheidend ist, ob wir lernen, ihn als das zu hören, was er in manchen Situationen ist: kein technischer Hinweis, sondern eine soziale Handlung.

Er kann eine Person aus dem Gespräch nehmen, ohne sie offen auszuschließen. Er kann Kritik entwerten, ohne sie zu widerlegen. Er kann alte Zweifel an migrantischer Intelligenz, muslimischer Redlichkeit, weiblicher Sachlichkeit oder Schwarzer Objektivität in eine neue Form bringen.

Die Maschine ist dabei nicht immer die Autorin. Manchmal ist sie nur der Vorwand.

Literaturhinweise

Benjamin, Ruha (2019): Race After Technology: Abolitionist Tools for the New Jim Code. Cambridge: Polity.

Flores, Nelson / Rosa, Jonathan (2015): „Undoing Appropriateness: Raciolinguistic Ideologies and Language Diversity in Education“. Harvard Educational Review, 85(2), 149–171.

Fricker, Miranda (2007): Epistemic Injustice: Power and the Ethics of Knowing. Oxford: Oxford University Press.

Liang, Weixin et al. (2023): „GPT detectors are biased against non-native English writers“. Patterns, 4(7).

Noble, Safiya Umoja (2018): Algorithms of Oppression: How Search Engines Reinforce Racism. New York: NYU Press.

KIAIMigrantenRassismusDiskursdebatte

Rami Ali

“Das klingt nach ChatGPT”

Über den neuen Echtheitsverdacht gegen migrantische Expertise

Literaturhinweise

Lokale Sichtbarkeit, globale Zusammenhänge. Ein Blick auf Zack Polanski von den UK Greens.

Wenn Forschung zur Zuspitzung wird

Sprechen wir über Ihr Anliegen.