Ich versuche mal etwas Klarheit in die Verwirrung zu bringen, die der Artikel bei manchen Hinterlassen hat. Der erste Satz beschreibt den Inhalt der Arbeit ganz gut: "...in dem sie darlegen, wie eine Künstliche Intelligenz mit Maschinellem Lernen anhand der Molekularstruktur von Stoffen deren Geruch vorhersagen können soll. "
Die Überschrift "Forschung: Google lehrt KI anhand von Molekularstruktur das Riechen" führt dagegen eher in die Irre.
Im Prinzip hat man aktuell der KI eine Datenbank mit chemischen Strukturformeln (Anordnung und Verbindungsmodus der Atome, wie Chemiker sie im Alltag symbolisch zeichnen) bekannter Geruchsstoffe gegeben. Die Formeln werden wohl von der KI zuerst irgendwie in eine besser verarbeitbare Form vereinfacht. Dann hat man die (von Menschen definierten) bekannten Geruchseigenschaften der Trainings-Geruchsstoffe dazu. Im Training lernt die KI nun -auf für Menschen wahrscheinlich nicht direkt nachvollziehbare Weise- typische Bestandteile von Molekürstrukturformeln mit jeweiligen Geruchsrichtungen zu assoziieren.
Nachdem das Training abgeschlossen war hat man eine Struktur, deren Geruchseigenschaft die KI noch nicht direkt gefüttert bekommen hat, der KI gegeben. Und diese hat dann den Geruch vorhergesagt - aber nur genau einen. Also z.B: zitronig. Aber nicht: süßlich-zitronig.
Das ist schon bemerkenswert, denn in vielen Fällen gelingt es den Chemikern eben noch nicht, den Geruch einer Substanz vorherzusagen, bevor man sie im Labor zusammengebraut und erstmals daran geschnuppert hat. Dafür sind die Vorgänge beim Riechen noch zu komplex und unverstanden.
Hauptanwendungsgebiet ist daher kurzfristig wohl eher wie beschrieben die Entwicklung z.B. von Parfums oder Aromen. So gibt es jetzt schon riesige Struktur-Datenbanken zu chemischen Substanzen, und wie diese sich erzeugen lassen. Aber oft fehlt vielleicht die Information über den Geruch. Die KI könnte nun die Information automatisiert ergänzen. Dann kann man auch rückwärts suchen: ich will mein Parfum zitronig riechen lassen, was könnte ich reinmischen: zack 10000 Substanzen. Dann paar Filter setzen: nicht giftig, aus pflanzlichen Rohstoffen herstellbar, Kosten unter X Euro pro Gramm, reagiert nicht mit den anderen Parfumbestandteilen. Dann bleiben vielleicht noch 10 Substanzen übrig, die ich dann besorgen und mit denen ich wirklich experimentieren kann. Und es sind wahrscheinlich welche darunter, auf die ich sonst nie gekommen wäre, weil sie nicht natürlich in der Zitrone oder im Zitronengras oder sowas vorkommen.
Den letzten Absatz des CB Autors und wo die Informationen dort herkommen, verstehe ich selbst nicht vollständig. Subjektivität beim Riechen/Beschreiben des Geruchs ist im professionellen Bereich eher ein Problem als ein Vorteil des Menschen. Und auch wenn das hier nicht gemacht wurde, könnte es vielleicht mit einem anderen Modell schon möglich sein eine Struktur mit zwei oder mehr Geruchsbeschreibungen (erdig und holzig) als Trainingsdatensatz zu haben oder auch mehrere Geruchsnoten (die besten Treffer?) auszuwerfen bei der Suche.
@Qualla: Die Erfassung von Strukturen z.B. aus einer unbekannten stinkenden Lösung bei der man alle riechenden Stoffe finden will, könnte man vermutlich vorschalten. Dafür gibt es verschiedenste Analysenmethoden. War aber hier nicht Ziel der Arbeit.
@Luthredon: Das Problem ist, dass Erde und Holz eigentlich verschiedenste Geruchsstoffe in einem Mix absondern. Wenn du jetzt aber wie hier nur genau einen Stoff hast, dann kann der durchaus von einer Person als "Teil von Erdgeruch"=erdig und von einer anderen als "Teil von Holzgeruch"=holzig beschrieben werden. 100% den Geruch z.B. von einer Frucht kriegt man selten mit einem einzelnen Stoff hin.
Hoffe mein Text hilft irgendwie weiter. Wenn Fehler auffallen, gerne melden, habe das Paper zum Teil auch nur quergelesen/überflogen und bin kein KI-Experte.