BREIN schaltet KI-Datensatz offline
Die niederländische Organisation BREIN die sich dem Schutz von Urheberrechten widmet, hat einen großen KI-Datensatz offline genommen. Dieser Datensatz war in der Landessprache der Niederlande verfügbar. Dritte hatten ihn unerlaubt verwendet – um ihre eigenen Modelle der synthetischen Intelligenz zu trainieren.
Illegaler Inhalt im Datensatz
BREIN stieß auf diesen illegalen Datensatz nach einem Hinweis. Der Inhalt umfasste Kopien von Zehntausenden E-Books und ebenfalls Millionen von Nachrichtenartikeln. Diese Artikel stammten unter anderem von bekannten News-Portalen wie nu.nl. Darüber hinaus waren auch Untertitel von zahlreichen Filmen und Fernsehsendungen enthalten. Viele dieser Quellen waren illegal.
Unlesbarkeit für Menschen
Der umfangreiche Datensatz war in einer Form komprimiert die zur Verwendung Menschen unlesbar war. Nur KI-Computermodelle — insbesondere große Sprachmodelle (LLMs) — konnten damit arbeiten. Obwohl dieser Datensatz nicht direkt als E-Book oder Nachrichtenseite genutzt werden konnte, war die Verwertung dennoch illegal. BREIN stellte klar – dass das Kopieren und Data Mining aus illegalen Quellen niemals gestattet ist.
Ignorierte Hinweise auf Verwertungsverbot
„Wir gehen gegen die unrechtmäßige Nutzung von künstlicher Intelligenz vor“, äußerte BREIN-Direktor Bastiaan van Ramshorst. Er sprach von über 10․000 Ergebnissen die aus dem Verwertungsverbot resultierten. Jedes einzelne Ergebnis bezog sich auf illegal kopierte Bücher. Auch wurden Nachrichtenartikel von urheberrechtlich geschützten Websites verwendet. Dies belegt die Missachtung der Urheberrechte.
Konsequenzen für den Urheber des Datensatzes
Nach der Entdeckung hat der Ersteller des Datensatzes diesen aus dem Netz entfernt. Zudem hat er eine strafbewährte Unterlassungserklärung unterzeichnet. Diese Erklärung enthält das Versprechen – die begangenen Rechtsverletzungen einzustellen. Des Weiteren wurden Informationen über die Empfänger des Datensatzes bereitgestellt — vermutlich auch jene die dafür bezahlt haben.
BREIN in Ermittlungen
BREIN untersucht welche KI-Modelle den illegalen Datensatz verwendet haben. Ziel ist es – die beteiligten Unternehmen zu kontaktieren. Um die rechtmäßige Nutzung sicherzustellen empfiehlt die Organisation den Rechteinhabern ihre Werke identisch dem niederländischen Urheberrechtsgesetz zu kennzeichnen.
Mangelnde Beachtung der Rechte
Viele Rechteinhaber der Organisation befolgen diesen Rat bereits. Doch in diesem speziellen Fall hätte es wahrscheinlich nicht geholfen. Der Autor des KI-Datensatzes ignorierte die bestehenden Hinweise auf die Quellenverwertung vollständig. Offenbar hatte er nie die Absicht – sich an geltende Gesetze zu halten.
Kommentare