DNA-Datenspeicher: Synthetische Basen speichern noch mehr Informationen
Forscher melden einen neuen Durchbruch für potenziellen Speicher der Zukunft auf Basis von künstlich erzeugter DNA. Durch das Hinzufügen synthetischer Basen sollen sich noch weitaus mehr Daten auf kleinstem Raum speichern lassen.
Bereits seit Jahren wird an einem Datenspeicher geforscht, der die Desoxyribonukleinsäure (DNS bzw. englisch DNA) nutzt, die in der Natur zum Speichern des Erbguts von Lebewesen dient. Ein künstlicher DNA-Speicher soll riesige Datenmengen auf winzigem Raum unterbringen und diese über Tausende Jahre und mehr behalten.
Mehr Basen für noch mehr Daten
US-Forscher haben jetzt eine Methode vorgestellt, mit der die bereits riesige Speicherdichte von DNA nochmals erhöht wird. Natürliche DNA speichert die Informationen über die Abfolge der vier Nukleinbasen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T). Einem Team der University of Illinois Urbana-Champaign ist es nun gelungen, den DNA-Speicher durch das Hinzufügen von sieben synthetischen Basen zu erweitern, wie ihr Artikel im Fachmagazin Nano Letters beschreibt. Ähnlich wie bei den Wörtern des Alphabets steigt die Zahl der möglichen Kombinationen und damit der auf diese Weise übersetzten Einsen und Nullen.
„Anstatt Nullen und Einsen in A, G, C und T umzuwandeln, können wir Nullen und Einsen in A, G, C, T und die sieben neuen Buchstaben des Speicheralphabets umwandeln“, verbildlicht Kasra Tabatabaei, einer der Forscher, das Prinzip.
Deep Learning hilft beim Auslesen
Parallel musste allerdings eine neue Methode zum Auslesen der Daten entwickelt werden, da nicht alle der derzeitigen Systeme mit den modifizierten DNA-Strängen umgehen können. Dabei kam eine Kombination aus Nanopore-Sequenzierung und Deep Learning mit Hilfe Künstlicher Intelligenz zum Einsatz.
„Wir haben 77 verschiedene Kombinationen der 11 Nukleotide ausprobiert, und unsere Methode war in der Lage, jede von ihnen perfekt zu unterscheiden [...] Das Deep-Learning-Framework ist als Teil unserer Methode zur Identifizierung verschiedener Nukleotide universell, was die Verallgemeinerung unseres Ansatzes auf viele andere Anwendungen ermöglicht“, erklärten die Forscher.
In ihrem wissenschaftlichen Artikel ist ferner von Potenzial für eine nahezu Verdoppelung der Speicherdichte und einer Reduktion der Latenz bei der Aufzeichnung um den gleichen Faktor die Rede.
Overall, the extended molecular alphabet may potentially offer a nearly 2-fold increase in storage density and potentially the same order of reduction in the recording latency, thereby enabling new implementations of molecular recorders.
Auszug aus dem Artikel bei Nano Letters
Die Infrastruktur lässt noch Wünsche offen
Prinzipiell ließen sich schon vor der neuen Methode 1 Million Terabyte in einem Kubikmillimeter DNA speichern. Wie Golem schreibt, ließe sich theoretisch das gesamte Internet in einem Speicher der Größe eines Schuhkartons ablegen.
Kompliziert und teuer sind aber noch die Geräte für das Speichern und Auslesen der DNA-Datenspeicher.
„Im Vergleich mit konventionellen Speichermedien sind die Verfahrensschritte aufwendig und teuer, schwierig zu automatisieren und nur schwer in praktikabel nutzbare mobile Systeme einzubinden. Deshalb sind sie vor allem für die stationäre Archivierung größter Datenmengen über lange Zeiträume hinweg geeignet. Aus technischer Sicht sollten sie hier bereits mittelfristig praktikabel einsetzbar sein“, heißt es in einem Artikel des Fraunhofer-Instituts.
Dem Startup CATALOG war es im Sommer 2019 gelungen, die englische Ausgabe von Wikipedia mit seinerzeit 16 GB Datenvolumen auf DNA zu speichern. Die Schreibgeschwindigkeit wurde mit 4 Megabit pro Sekunde (0,5 MB/s) angegeben, was verdeutlicht, dass auch die Transferraten noch ein Problem darstellen.