KI-Spürnase: OpenAI durchschaut Paywall-Bücher – Studie enthüllt verblüffende Trefferquote

ChatGPT Logo
Quelle: OpenAI

Ein aufsehenerregender Test des AI Disclosures Project wirft neue Fragen zur Nutzung geschützter Inhalte für KI-Trainingsdaten auf: Forscher überprüften, ob OpenAIs Modelle Texte aus kostenpflichtigen O’Reilly-Fachbüchern erkennen – selbst wenn diese umformuliert wurden. Dazu generierte das KI-System Claude 3.5 Sonnet Paraphrasen von 3.962 Abschnitten aus 34 Büchern, die normalerweise hinter Paywalls liegen.

Die Ergebnisse im Detail:

  • GPT-4o glänzte mit einer 82 %-Erkennungsrate (gemessen am AURUC-Wert*) und identifizierte die Ursprungstexte am zuverlässigsten.
  • GPT-3.5 Turbo schnitt schwächer ab, lag aber immer noch im signifikanten Bereich.
  • GPT-4o Mini zeigte keine Spuren der O’Reilly-Inhalte – vermutlich, weil kleinere Modelle komplexe Tests weniger gut bestehen.

*Der AURUC-Wert misst, wie präzise ein KI-Modell Originalinhalte trotz Umarbeitung erkennt.

Die hohe Trefferquote bei GPT-4o legt nahe, dass OpenAI möglicherweise paywall-geschützte Werke in Trainingsdaten integriert hat – ein heikler Punkt im Urheberrechts-Diskurs. Gleichzeitig zeigt der Test Grenzen auf: Kleinere KI-Modelle scheinen weniger „erinnerungsfähig“ zu sein, was Datenschützer:innen beruhigen könnte.

Offene Fragen bleiben aber: Wurden die Bücher tatsächlich fürs Training genutzt, oder erkennt die KI Muster zufällig? Wie transparent sind Tech-Konzerne bei der Auswahl ihrer Datenquellen? Fragen, die noch geklärt werden müssen.

Die Studie unterstreicht einmal mehr: Die Debatte um KI-Ethik und Copyrights ist längst nicht durchgespielt. Während OpenAI schweigt, dürften Anwälte und Autoren nun genauer hinschauen.

Quelle(n):
Gadgets360

Links mit einem * sind Partner-Links. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!

Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Telegram, WhatsApp, Mastodon, Threads, Bluesky oder auf Facebook oder abonniere meinen RSS-Feed!

Smartphoneblogger

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert