OpenAI nutzt YouTube-Videos zum Trainieren von GPT-4 – Verstoß gegen die Regeln?
Generative KI-Modelle wie GPT-4 von OpenAI beeindrucken mit ihren Fähigkeiten, werfen aber auch Fragen nach der Ethik und den Grenzen der Datennutzung auf.
Ein Bericht der New York Times enthüllt, dass OpenAI über eine Million Stunden YouTube-Videotranskripte zum Training von GPT-4 verwendet hat. Dies verstieß gegen die Regeln der Plattform, die das Scraping von Inhalten verbieten. OpenAI argumentierte, es handele sich um eine „faire Nutzung“ von öffentlich zugänglichen Videos. YouTube widerspricht dieser Ansicht und verweist auf seine Nutzungsbedingungen, die das Herunterladen von Inhalten ohne Erlaubnis verbieten.
Der Bericht zeigt auch, dass Google ebenfalls Transkripte von YouTube-Videos verwendet, um seine KI-Modelle für Gemini zu trainieren. Google rechtfertigt dies mit Änderungen seiner Nutzungsbedingungen, die die Verwendung von Daten aus „öffentlich sichtbaren Datenpunkten“ erlauben.
Die aggressive Datensammlung durch KI-Unternehmen wie OpenAI und Google wirft Bedenken hinsichtlich der Privatsphäre und der Kontrolle über die eigenen Daten auf. Es wird erwartet, dass die Nutzung von „Grauzonen“-Datenquellen für das Training von KI-Modellen zunehmen wird, da die Menge der verfügbaren Daten abnimmt.
Quelle(n):
The New York Times
Links mit einem * sind Partner-Links. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich eine kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!
Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Telegram, WhatsApp, Mastodon, Threads, Bluesky oder auf Facebook oder abonniere meinen RSS-Feed!