News Llama-Training: Meta muss erklären, warum Copyright-Flags entfernt wurden

In der AI Branche ist das Motto erstmal machen und später über das richtig/falsch nachdenken.
Hauptsache man ist ganz vorne mit dabei.
 
Zoba schrieb:
Das schlimmste daran war ja wohl, dass Facebook auch nur geleeched und nicht geseeded hat!

Wenn die Trainingsdaten über das Modell zugänglich gemacht werden, zieht die Argumentation imho nicht mehr und die Entfernung der Copyright-Daten spricht ebenfalls Bände.

Würden wir hier über eine Privatperson reden:
https://www.computerwoche.de/article/2611749/millionenstrafe-fuer-illegalen-musik-download.html

Zum Glück muss Meta so etwas nicht fürchten, wäre ja dramatisch, wenn wir Facebook, WhatsApp und co. verlieren würden... nicht.
 
  • Gefällt mir
Reaktionen: areiland
JoergB schrieb:
[...]
Neue Technologien benötigen auch eine gesellschaftlich Bewertung.
Stimme ich dir voll und ganz zu, nur wie sollte das umgesetzt oder nachträglich abgewickelt werden? Ich bin selbst Content Creator und meine Werke sind im Internet. Sowie seit längeren auf Piraten(Warez)seiten zu finden. Content der erstmal im Internet gelandet ist, bleibt dort und ist mehr oder weniger Frei zugänglich.

Hier hat sich Meta auch an den illegal im Netz befindlichen Büchern bedient. Nur wie möchtest du als Contentcreator nachweisen, dass dein Werk zum AI Training verwendet wurde? Wie hoch ist der Schaden der dir dadurch entstanden ist? Und wie möchtest du diesen Schaden geltend machen, wenn es um AI's geht die ausserhalb der Rechtsprechung deines Landes liegen.

Sehr schwierig.
 
Bahkauv schrieb:
Einfach 10% vom Gewinn des letzten Jahres als Strafe. Das sollte dann auch die anderen Verbrecher abschrecken. Das Geld wird dann für soziale Projekte verwendet.
Man beißt nicht die Hand, die einen füttert. In der Politik sitzen zum Großteil Marionetten der Wirtschaftslobby drin. Die kommen bereits aus der Wirtschaft oder wollen nach ihrer politischen Karriere noch ein verünftigen Vorstandsposten einnehmen und da kommt es nicht gut wenn man Politik macht, die Unternehmen einschränkt.

Formal gäbe es sogar häufig Möglichkeiten für hohe Strafen, die werden jedoch so gut wie nie ausgereizt, wie man jetzt an der EU DMA Thematik und Apple bzw. Meta sieht, aus Angst vor dem bad orange man oder es wird ewig hinausgezögert durch alle Instanzen und jahrelange Gerichtsprozesse. In der Zeit hat man durch das eigentlich illegale Vorgehen schon so viel Geld und Macht zugewonnen, dass die Prozesskosten peanuts sind.

Am Ende muss man sich immer darüber im Klaren sein, dass konservative, rechte und oder wirtschaftsliberale Parteien niemals Politik & Gesetze machen werden, die für normale Bürger gut ist.
 
  • Gefällt mir
Reaktionen: areiland
Gibt es ein Gesetz, das es einem Computer verbietet sowas "zu lesen"? Google "liest" sowas doch auch die ganze Zeit und zeigt sogar Copyright-Bilder auf der eigenen Website.

Und was soll überhaupt der Schaden sein? Ich denke nicht, dass dadurch irgendwelche Einnahmen verloren gehen oder weniger Bücher verkauft werden wenn sowas zur Forschung und Evaluation von neuen Technologien benutzt wird.
Da wurde ja kein kommerzielles Modell trainiert um Geld zu generieren. (Das nächste Modell wird dann einfach später, auf Basis der Outputs des ersten Modells trainiert und alle sind glücklich. :D)

Es ist unmöglich, das training von AIs irgendwie zu kontrollieren und zu regulieren. Wer das glaubt, hat die Problematik einfach noch nicht begriffen.
 
@aLanaMiau Das LLM gibt hier Zugriff auf Daten, auf die ansonsten kein freier Zugriff verfügbar ist (Inhalt von Büchern, die müsste man kaufen). Weiters durften die besagten Bücher gar nicht zum trainieren von LLMs verwendet werden, da es die Lizenz verbietet.
Oben drauf kommt noch, dass es offensichtlich kein Versehen war, sondern die Daten sogar entsprechend bearbeitet wurden damit man die Copyright Infos nicht auch noch ausgibt - also wurden vorsätzlich Daten verwendet und veröffentlicht, die geschützt sind.

Das Problem konkret ist natürlich die Veröffentlichung davon. Würde das Unternehmen diese Daten nur intern zu Forschungszwecken verwenden, dann wäre die Klage vermutlich hinfällig. Aber nachdem die Modelle öffentlich verfügbar sind, haben sie geschütztes Material veröffentlicht.
 
  • Gefällt mir
Reaktionen: Valeria
hallo7 schrieb:
Das LLM gibt hier Zugriff auf Daten, auf die ansonsten kein freier Zugriff verfügbar ist (Inhalt von Büchern, die müsste man kaufen).
Das ist leider falsch. Die Inhalte sind/waren nicht frei verfügbar, sondern Zugang gibt es nur für Forschungszwecke. In den USA sind Forschungszwecke auch übrigens sehr strikt geregelt und fallen unter Fair-Use. Somit ist:
hallo7 schrieb:
Weiters durften die besagten Bücher gar nicht zum trainieren von LLMs verwendet werden, da es die Lizenz verbietet.
leider vollkommen irrelevant und findet keine Anwendung. So wie das Gericht es auch schon entschieden hat.
 
Th31X schrieb:
Stimme ich dir voll und ganz zu, nur wie sollte das umgesetzt oder nachträglich abgewickelt werden?
Das ist halt ein Thema wo alle gefordert sind, ich habe auch noch keine Ahnung wie das umgesetzt werden kann.
Vor der Pauschalabgabe wurde auch raubkopiert was das Zeug hielt, bis man zu einer Einigung dort kam.
Mit KI brechen halt neue Zeiten an.
Th31X schrieb:
[...]
Sehr schwierig.
So ist es, sehr schwierig, aber es sind neue Herausforderungen, denen wir uns stellen müssen.
 
Zurück
Oben