denglisch schrieb:
Dir ist schon klar dass nicht jeder Code auf GitHub einfach mal in andere Software integriert werden kann? Die Lizenz muss beachtet werden, sonst kann Schadensersatz und Unterlassung eingeklagt werden. GPL ist hier ein gutes Beispiel.
Genauso wenig habe ich geschrieben, dass Entwickler die sich daran bedienen, dass Projekt 1:1 übernehmen, sondern gemeint war hauptsächlich die Information.
Und neuronale Netze speichern den Code erst recht nicht ab, da es wie gesagt, ein neuronales Netz ist und keine Datenbank von CodeSnippets oder ähnlichem.
denglisch schrieb:
Das ist eben nicht in Ordnung, und wird daher auch in wissenschaftlichen Arbeiten als Plagiat bezeichnet, und führt dazu dass man seinen Abschluss verliert.
Ja und da eine KI Zugriff auf das Internet hat kann diese auch auf die originalen Quellen verweisen. Das macht Bing bereits und hat ChatGPT bis zum abschalten des Browser PlugIns auch. Dementsprechend arbeitet Bing/ChatGPT bereits wissenschaftlich korrekter als die 0815 Blogs, die gar keine Verweise liefern.
denglisch schrieb:
So einfach ist das nicht. Clean-Room-Implementations sind nicht ohne Grund ein Ding. Hier wird häufig verlangt dass derjenige der den Code gelesen hat nicht der ist der ihn reimplementiert. Es läuft also darauf hinaus dass man eine grobe und abstrakte Wiedergabe der Prinzipien hat und es dann nochmals implementiert.
Jup und das ist auch absoluter Quatsch und einfach nur Fortschrittsbehinderung, wenn ich die Informationen vorher öffentlich ins Internet stelle.
Wenn ich Informationen öffentlich ins Internet stelle, dann muss ich damit rechnen, dass Menschen diese Informationen extrahieren und daraus lernen und nicht noch eine weitere Person als Proxy dazwischen klemmen damit auch bloß nichts so implementiert wird, wie man es aus der Quelle an Wissen extrahiert hat.
Wenn es mir so wichtig ist, dass keiner was davon hat oder nur ein gewählter Personenkreis, bspw. bei Firmeninternen Angelegenheiten dann lädt man solche Informationen nicht frei ins Internet.
Und diese Argumentation lässt sich analog für neuronale Netze führen. Es werden Informationen eingespeißt aber es werden keine Texte im neuronalen Netz gespeichert. Es werden lediglich Verbindungen mit anderen Nodes manipuliert. Nichts anderes (vereinfacht) passiert in unserem Gehirn.
Entweder ich stelle Wissen öffentlich ins Internet und finde mich damit ab, dass Menschen daraus lernen, Informationen ableiten, ihr Skillset erweitern/verbessern und dies nutzen, oder ich stelle es nicht ins Internet ganz einfach.
Was hier wieder für eine Hexenjagd für
frei verfügbare Informationen angestellt wird, ist mal wieder ein Paradebeispiel wieso Deutschland bei der Digitalisierung genau da steht wo es steht.