News DNA-Datenspeicher: Synthetische Basen speichern noch mehr Informationen

Hm, beim Auslesen der Daten bin ich noch skeptisch. Es ist bis heute ein großes Problem DNA fehlerfrei zu sequenzieren. Die Vorstellung, dass man die DNA z.B. einer menschlichen Zelle irgendwie fixiert und einmal durch den Bioscanner zieht, ist leider illusorisch. Stattdessen bekommt man je nach Sequenziermethode verschieden große Schnipsel (Reads) mit verschieden hoher Fehlerrate. Die Nanopore-Daten, mit denen ich bisher gearbeitet habe, hatten Reads mit 10.000 bis 100.000 Länge (im Vergleich dazu sind Chromosome über 100 Millionen Basen lang), dafür aber einer Fehlerrate von 10-15%(!). Ja, 10-15% der Basen, die man liest sind falsch. Deswegen muss man ein Sample sehr tief sequenzieren, so 30 mal, damit man von jeder Stelle genug Material hat, um das Mosaik wieder zusammenzuflicken. Wenn man das "mal eben so" mit Deep Learning gerade biegen könnte, würde das schon jeder verwenden, weil tiefe Sequenzierung teuer ist Genome teilweise so schwer aufzulösen sind, dass es auch mit tiefer Sequenzierung nicht geht.
 
  • Gefällt mir
Reaktionen: floq0r
Wie Golem schreibt, ließe sich theoretisch das gesamte Internet in einem Speicher der Größe eines Schuhkartons ablegen.

EldersOfTheInternet (1).jpg
 
  • Gefällt mir
Reaktionen: dominiczeth, FakyFake, Bl4cke4gle und eine weitere Person
ghecko schrieb:
Jetzt müssen wir nur noch raus finden, wie man einen DNA-Strang (zerstörungsfrei) parallel ausliest.
Muss man ja nicht. Wenn man z.B. AGT ausliest ist durch dem Komplämentärsprinzip nach die Gegenseite eben TCA, mit dem ablesen einer Seite werden also indirekt beide gelesen.
Du hast vielleicht an das Okazaki-Fragment gedacht, die "Paralellität" wäre erstmal nur für die biologische Transkription wesentlich, bei der Datenspeicherung werden aber ja keine Proteine synthethisiert.
(Oder doch? Wie die daten jetzt genau ausgelesen werden steht ja leider nicht im Text.)
ghecko schrieb:
Um mal eine Idee davon zu bekommen, wie das auf Molekularebene aussieht:
Der Gedanke, dass dieses Speichermedium ursprünglich nicht aus Area 51 stammt sondern der menschlichen Zelle haut mich jetzt noch um.
 
Zuletzt bearbeitet:
CyrionX schrieb:
Muss man ja nicht. Wenn man z.B. AGT ausliest ist durch dem Komplämentärsprinzip nach die Gegenseite eben TCA, mit dem ablesen einer Seite werden also indirekt beide gelesen.
Schon, aber das Verfahren ist nach wie vor Linear, also dem Strang entlang. Transkription nach RNA mit aktuell existierenden Proteinen ist also dementsprechend langsam.
Um die Auslesegeschwindigkeit zu erhöhen müsste man den Strang segmentieren, also an mehreren Stellen gleichzeitig auslesen. Um ihn für eine einzige, nicht segmentierte, parallele RNA-Transscription komplett zu öffnen ist er schlicht zu lang befürchte ich. Das Protein dafür wäre zu komplex.

Aber wer weiß wie die das auslesen wollen. Reguläres DNA-Seqenzieren ist natürlich die logischste Variante, geht aber nicht zerstörungsfrei und wohl nicht schnell genug.
 
ghecko schrieb:
Schon, aber das Verfahren ist nach wie vor Linear, also dem Strang entlang. Transkription nach RNA mit aktuell existierenden Proteinen ist also dementsprechend langsam.
Nicht unbedingt, es geht ja nicht rein um die lineare Lesegeschwindigkeit, die unter leicht höherer Temperatur als im menschlichen Körper auch gesteigert werden könnte.
Es braucht nicht der ganze Strang gelesen zu werden, ähnlich den Indexes auf HDDs und Plattern.
Eine Art Crispr-Cas9/Transkriptase Hybrid der sich den exakten Datenlese-Startpunkt direkt aussucht wäre schon was feines. (Auch wenn das ferne Zukunftsmusik ist)

Ansonsten: Auf der DNA könnte das wie auf dem klassischem Wege passieren mit Start/Stopp Codons und Operons ("versteckte Partitionen"), eine Aufteilung in mehrere/viele kürzere Einzelstränge kommt auch in Betracht.
Das entsprechende Segment wird dann gesplittet und abgelesen, falls notwendig auch rückwärts.

Anstatt Paralell abzulesen könnte man ja auch Dual ablesen, ähnlich mehrerer controller in SSDs.
Also der gleiche DNA Strang 2x, nur kommen einmal "normal" laufende und einmal rückwärtslaufende Transkriptions-Proteine zum Einsatz ( von denen ich nicht weiss ob so eines bereits existiert denn Reverse Transkription ist etwas anderes)

Aber ganz ehrlich, es würde mich nicht wundern wenn am Ende der Strang durch einen künstlichen Super Proteinblock gezogen oder das ganze einfach mittels Laser abgefahren wird. Die Möglichkeiten scheinen mir jedenfalls nicht zu limitiert.
 
Zuletzt bearbeitet:
Hört sich interessant an. Und wie sieht das Zeug dann aus, welches man in seinen Schuhlarton packt, um das Internet herunterzuladen?

Könnte in einer mittleren Zukunft sicher Magnetbänder als Archivierungsmethode absetzen. Wenn die eine praxistaugliche Schreibrate hinkriegen. Mit 0,5MB/s dauert es über 3 Wochen um 1TB zu speichern.

Für diese eine Million Terabyte in einem Kubikmeter wären das dann ca. 63.000 Jahre, wenn ich mich nicht verrechnet habe.

Aber, die Schreibrate bezieht sich ja auf ein anderes Projekt. Und es ist ja auch erst der Anfang.

Forum-Fraggle schrieb:
Ich hätte eher gedacht Du denkst dabei an DN Server ;)
Als Informatiker muss ich hier aber einschreiten :D
Es heißt DNS Server, hier steht das S noch für was anderes (Domain Name System). Anders als z.B. beim altbekannten "LCD Display" mit doppeltem Display.
 
  • Gefällt mir
Reaktionen: mojitomay und justFlow
Ein Langzeitspeicher, dessen Auslesen von KI abhängig ist? Das schreit für mich nach Datenverlust-Risiko, weil die KI irgendwas falsch klassifiziert.
 
  • Gefällt mir
Reaktionen: Larnak und mojitomay
Ich finde das richtig spannend…wenn man das geheime Familienerbe die ganze Zeit mit sich herumträgt :D
oder:
Im neuen James Bond: Frankenstein, wo ein Doppelagent geheime Pläne für eine Biowaffe in seinem linken Hoden ins Heimatland schmuggelt :D
 
So ... jetzt mal Hand aufs Herz. Wer von euch dachte beim lesen des Artikels nicht an Horizon Zero Dawn :D
 
ghecko schrieb:
Jetzt müssen wir nur noch raus finden, wie man einen DNA-Strang (zerstörungsfrei) parallel ausliest.
Um mal eine Idee davon zu bekommen, wie das auf Molekularebene aussieht:

Forschung in die Richtung kommt immer auch der Humanmedizin zugute.
Danke für's Einfügen des Videos. Das war glaube ich mit Abstand das interessanteste, was ich seit langem auf Youtube gesehen habe (abgesehen von den kurzgesagt-Videos)
 
snoop83 schrieb:
Das war glaube ich mit Abstand das interessanteste, was ich seit langem auf Youtube gesehen habe
Lohnt sich auf jeden Fall das mal visuell zu sehen, entgegen dem trockenen Schulstoff. Besonders die Protein Synthese aus RNA hab ich erst so richtig kapiert, als ich es gesehen hab:
 
Zurück
Oben