Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
News Llama-Training: Meta muss erklären, warum Copyright-Flags entfernt wurden
- Ersteller mischaef
- Erstellt am
- Zur News: Llama-Training: Meta muss erklären, warum Copyright-Flags entfernt wurden
Muntermacher
Lt. Commander
- Registriert
- Sep. 2022
- Beiträge
- 1.278
Zoba schrieb:Das schlimmste daran war ja wohl, dass Facebook auch nur geleeched und nicht geseeded hat!
Wenn die Trainingsdaten über das Modell zugänglich gemacht werden, zieht die Argumentation imho nicht mehr und die Entfernung der Copyright-Daten spricht ebenfalls Bände.
Würden wir hier über eine Privatperson reden:
https://www.computerwoche.de/article/2611749/millionenstrafe-fuer-illegalen-musik-download.html
Zum Glück muss Meta so etwas nicht fürchten, wäre ja dramatisch, wenn wir Facebook, WhatsApp und co. verlieren würden... nicht.
Stimme ich dir voll und ganz zu, nur wie sollte das umgesetzt oder nachträglich abgewickelt werden? Ich bin selbst Content Creator und meine Werke sind im Internet. Sowie seit längeren auf Piraten(Warez)seiten zu finden. Content der erstmal im Internet gelandet ist, bleibt dort und ist mehr oder weniger Frei zugänglich.JoergB schrieb:[...]
Neue Technologien benötigen auch eine gesellschaftlich Bewertung.
Hier hat sich Meta auch an den illegal im Netz befindlichen Büchern bedient. Nur wie möchtest du als Contentcreator nachweisen, dass dein Werk zum AI Training verwendet wurde? Wie hoch ist der Schaden der dir dadurch entstanden ist? Und wie möchtest du diesen Schaden geltend machen, wenn es um AI's geht die ausserhalb der Rechtsprechung deines Landes liegen.
Sehr schwierig.
mf4t4lr
Lieutenant
- Registriert
- Sep. 2019
- Beiträge
- 669
Man beißt nicht die Hand, die einen füttert. In der Politik sitzen zum Großteil Marionetten der Wirtschaftslobby drin. Die kommen bereits aus der Wirtschaft oder wollen nach ihrer politischen Karriere noch ein verünftigen Vorstandsposten einnehmen und da kommt es nicht gut wenn man Politik macht, die Unternehmen einschränkt.Bahkauv schrieb:Einfach 10% vom Gewinn des letzten Jahres als Strafe. Das sollte dann auch die anderen Verbrecher abschrecken. Das Geld wird dann für soziale Projekte verwendet.
Formal gäbe es sogar häufig Möglichkeiten für hohe Strafen, die werden jedoch so gut wie nie ausgereizt, wie man jetzt an der EU DMA Thematik und Apple bzw. Meta sieht, aus Angst vor dem bad orange man oder es wird ewig hinausgezögert durch alle Instanzen und jahrelange Gerichtsprozesse. In der Zeit hat man durch das eigentlich illegale Vorgehen schon so viel Geld und Macht zugewonnen, dass die Prozesskosten peanuts sind.
Am Ende muss man sich immer darüber im Klaren sein, dass konservative, rechte und oder wirtschaftsliberale Parteien niemals Politik & Gesetze machen werden, die für normale Bürger gut ist.
aLanaMiau
Lieutenant
- Registriert
- Jan. 2023
- Beiträge
- 968
Gibt es ein Gesetz, das es einem Computer verbietet sowas "zu lesen"? Google "liest" sowas doch auch die ganze Zeit und zeigt sogar Copyright-Bilder auf der eigenen Website.
Und was soll überhaupt der Schaden sein? Ich denke nicht, dass dadurch irgendwelche Einnahmen verloren gehen oder weniger Bücher verkauft werden wenn sowas zur Forschung und Evaluation von neuen Technologien benutzt wird.
Da wurde ja kein kommerzielles Modell trainiert um Geld zu generieren. (Das nächste Modell wird dann einfach später, auf Basis der Outputs des ersten Modells trainiert und alle sind glücklich.
)
Es ist unmöglich, das training von AIs irgendwie zu kontrollieren und zu regulieren. Wer das glaubt, hat die Problematik einfach noch nicht begriffen.
Und was soll überhaupt der Schaden sein? Ich denke nicht, dass dadurch irgendwelche Einnahmen verloren gehen oder weniger Bücher verkauft werden wenn sowas zur Forschung und Evaluation von neuen Technologien benutzt wird.
Da wurde ja kein kommerzielles Modell trainiert um Geld zu generieren. (Das nächste Modell wird dann einfach später, auf Basis der Outputs des ersten Modells trainiert und alle sind glücklich.

Es ist unmöglich, das training von AIs irgendwie zu kontrollieren und zu regulieren. Wer das glaubt, hat die Problematik einfach noch nicht begriffen.
@aLanaMiau Das LLM gibt hier Zugriff auf Daten, auf die ansonsten kein freier Zugriff verfügbar ist (Inhalt von Büchern, die müsste man kaufen). Weiters durften die besagten Bücher gar nicht zum trainieren von LLMs verwendet werden, da es die Lizenz verbietet.
Oben drauf kommt noch, dass es offensichtlich kein Versehen war, sondern die Daten sogar entsprechend bearbeitet wurden damit man die Copyright Infos nicht auch noch ausgibt - also wurden vorsätzlich Daten verwendet und veröffentlicht, die geschützt sind.
Das Problem konkret ist natürlich die Veröffentlichung davon. Würde das Unternehmen diese Daten nur intern zu Forschungszwecken verwenden, dann wäre die Klage vermutlich hinfällig. Aber nachdem die Modelle öffentlich verfügbar sind, haben sie geschütztes Material veröffentlicht.
Oben drauf kommt noch, dass es offensichtlich kein Versehen war, sondern die Daten sogar entsprechend bearbeitet wurden damit man die Copyright Infos nicht auch noch ausgibt - also wurden vorsätzlich Daten verwendet und veröffentlicht, die geschützt sind.
Das Problem konkret ist natürlich die Veröffentlichung davon. Würde das Unternehmen diese Daten nur intern zu Forschungszwecken verwenden, dann wäre die Klage vermutlich hinfällig. Aber nachdem die Modelle öffentlich verfügbar sind, haben sie geschütztes Material veröffentlicht.
aLanaMiau
Lieutenant
- Registriert
- Jan. 2023
- Beiträge
- 968
Das ist leider falsch. Die Inhalte sind/waren nicht frei verfügbar, sondern Zugang gibt es nur für Forschungszwecke. In den USA sind Forschungszwecke auch übrigens sehr strikt geregelt und fallen unter Fair-Use. Somit ist:hallo7 schrieb:Das LLM gibt hier Zugriff auf Daten, auf die ansonsten kein freier Zugriff verfügbar ist (Inhalt von Büchern, die müsste man kaufen).
leider vollkommen irrelevant und findet keine Anwendung. So wie das Gericht es auch schon entschieden hat.hallo7 schrieb:Weiters durften die besagten Bücher gar nicht zum trainieren von LLMs verwendet werden, da es die Lizenz verbietet.
Das ist halt ein Thema wo alle gefordert sind, ich habe auch noch keine Ahnung wie das umgesetzt werden kann.Th31X schrieb:Stimme ich dir voll und ganz zu, nur wie sollte das umgesetzt oder nachträglich abgewickelt werden?
Vor der Pauschalabgabe wurde auch raubkopiert was das Zeug hielt, bis man zu einer Einigung dort kam.
Mit KI brechen halt neue Zeiten an.
So ist es, sehr schwierig, aber es sind neue Herausforderungen, denen wir uns stellen müssen.Th31X schrieb:[...]
Sehr schwierig.