Künstliche Intelligenz: Erstes Buch eines Algorithmus veröffentlicht
Seit einiger Zeit versuchen Wissenschaftler, komplexe Texte durch Algorithmen erstellen zu lassen. Von diesem Ziel ist man nach heutigem Stand zwar noch weit entfernt, dennoch kann künstliche Intelligenz bei der Erstellung von Texten helfen, wie nun die Veröffentlichung des ersten durch einen Algorithmus erstellten Buches zeigt.
Einem Autor noch nicht ebenbürtig
Die komplette Eigenentwicklung eines Buches, welches sich an den Inhalten eines guten Autors messen lassen kann, liegt noch in weiter Ferne. Dennoch haben Wissenschaftler der Goethe-Universität Frankfurt am Main am Beispiel von „Lithium-Ion Batteries – A Machine-Generated Summary of Current Research“, dem ersten durch einen Algorithmus zusammengestellten, bearbeiteten und in einem Verlag veröffentlichten Buch gezeigt, was künstliche Intelligenz in diesem Bereich bereits zu leisten vermag.
Das nun im Springer-Verlag erschienene Buch steht der Allgemeinheit als Download kostenlos zur Verfügung und soll dem Leser einen Überblick über die neuesten Forschungspublikationen im Bereich der Lithium-Ionen-Batterien verschaffen.
Inhalte selbstständig ausgesucht, angepasst und zusammengefügt
Mit einem unter der Leitung von Juniorprofessor Dr. Christian Chiarcos an der Angewandten Computerlinguistik an der Goethe-Universität entwickelten und auf den Namen Beta Writer hörenden Algorithmus wurden zunächst für das Thema auf der Plattform SpringerLink veröffentlichte Publikationen automatisch untersucht und relevante Inhalte ausgewählt. Diese wurden von Beta Writer einem ähnlichkeitsbasierten Clustering unterzogen, um die Quelldokumente in zusammenhängende Kapitel und Abschnitte gliedern zu können. Anschießend wurden die Zusammenfassungen der publizierten Artikel eingefügt und miteinander verflochten sowie die extrahierten Textpassagen mit Hyperlinks versehen, so dass der Leser für weitere Informationen eindeutige Verweise auf die Quelldokumente erhält. Gleichzeitig sollen automatisch erstellte Inhaltsverzeichnisse und Referenzen dem Leser die Orientierung innerhalb des Buchprototypen erleichtern.
Chancen und Anforderungen aufgezeigt
Mit diesem Projekt wollte das Team rund um Christian Chiarcos zeigen, welche Anforderungen mittlerweile von maschinengenerierten Publikationen erfüllt werden können und welche Möglichkeiten sich ergeben, wenn „Fachleute aus wissenschaftlichen Verlagen mit Computerlinguisten zusammenarbeiten“. Gleichzeitig wurden erneut viele bekannte Probleme deutlich, vor allem wenn es um die Erwartungen der Autoren, Herausgeber, Verlage und Käufer geht – auch in Bezug auf die wissenschaftlichen und wirtschaftlichen Anforderungen.
Prototyp als wichtiger Meilenstein
Henning Schoenenberger, Director Product Data & Metadata Management bei Springer Nature, sieht die Rolle von Autoren aktuell noch unberührt, was sich jedoch in absehbarer Zeit durchaus ändern könnte: Während von Wissenschaftlern und Autoren geschriebene Inhalte derzeit für ihn weiterhin die entscheidende Rolle bei der Publikation von wissenschaftlichen Texten spielen werden, erwartet er in Zukunft eine größere Bandbreite an Inhaltstypen. Diese könnten sich „von vollständig von Menschen erstellten Inhalten über verschiedene Blended-Man-Machine-Textgenerierungen hin zu vollständig maschinengenerierten Texten“ erstrecken. Darüber hinaus gehen die verschiedenen Segmente fließend ineinander über, so dass eine vollständige Abgrenzung schwierig wird.
Der jetzt geschaffene Prototyp stellt für Schoenenberger einen ersten und wichtigen Schritt in diese Richtung dar. Gleichzeitig hofft er „eine öffentliche Debatte über die Chancen, Auswirkungen, Herausforderungen und potenziellen Risiken von maschinengenerierten Inhalten im wissenschaftlichen Umfeld anzustoßen“.