Daten kopieren - KOPIEvonKOPIEvonKOPIE.. Wann treten Fehler auf?

berlyn

Cadet 3rd Year
Registriert
Feb. 2017
Beiträge
38
Hallo Leute,

ich habe eine praktische Frage:
wenn ich eine Datei 100.000mal bis millionen-fach kopiere (also immer KOPIEvonKOPIEvonKOPIE...)

wann treten dann erste Fehler auf?
Dabei gehe davon aus das die HDD-Festplatte technisch & mechanisch
immer in einem guten Zustand ist.
Es geht mir dabei um HDD-Festplatten mit Lesekopf und Magnetscheiben, keine SSD's!


Ich habe seit dem Jahr 1999 meine Datensammlungen. Dabei bevorzuge
ich immer die Original-Kopie wenn möglich von der ältesten Erstellung.
Wenn ich meine Daten jetzt mit jeder neuen HDD immer weiter verschiebe,
wann treten erst Fehler auf?
Theoretisch wenn es die 100.000ste Festplatten-KOPIE ist?
Ich habe jetzt seit 22jahren Dokumente & es gab mit Windows
keinen einzigen sichtbaren Fehler in der Dateistruktur. Videos, Musik & Dokumente immer tadellos.
Da war mal ein Bild-Dokument was oben noch intakt war, und dann nur noch graue Zeilen.

Ich hatte immer Glück und bei meinen Festplatten ist kein mechanischer Defekt aufgetreten.
Den Faktor einer mechanisch beschädigten Festplatte kann man vernachläßigen.
Heute sind 20TB in einer 3,5"-HDD von Seagate bereits für den Massenmarkt verfügbar.
{{{ Da große Speichermengen für Archive immer wichtiger werden,
werden die Magnetscheiben bald durch Glas ersetzt.
Mit der neuen Glastechnik sind dann Speichermengen mit 100TB normal. }}}

Grüßè und Dank

Zitat: "Schatz das Internet ich schon wieder voll".
-------Er: "Stelle es an die Treppe, ich nehme es mit runter" ------vonRadioFritz


➜➜hier ein paar anschauliche Beispiele, im Anhang -------🖼️
 

Anhänge

  • cb - Beispiel 6x verrauschte -Bild Dateien - wiederhergestellt  FileScavenger 6xJPG.png
    cb - Beispiel 6x verrauschte -Bild Dateien - wiederhergestellt FileScavenger 6xJPG.png
    112 KB · Aufrufe: 281
  • cb - Beispiel verrauschte WAV Dateien - rescue FileScavenger 6xWAVmerged_VBR5js_32-56kbps-MP3.mp3
    cb - Beispiel verrauschte WAV Dateien - rescue FileScavenger 6xWAVmerged_VBR5js_32-56kbps-MP3.mp3
    279,2 KB
  • cb - Beispiel 2x verrauschte -Bild Dateien - wiederhergestellt  FileScavenger 2xJPG.jpg
    cb - Beispiel 2x verrauschte -Bild Dateien - wiederhergestellt FileScavenger 2xJPG.jpg
    139,2 KB · Aufrufe: 269
Zuletzt bearbeitet:
bis das filesystem sich an den entstehenden pfadlängen verschluckt, nehme ich an.
diese grenze wird sicher vor dem physischen krepieren der platte erreicht.
 
Schwierig zu sagen. Wenn du Kopien auch auf unterschiedlichen Datenträgern anfertigst bist du auf der sicheren Seite (und die Hardware ist nicht veraltet).

Wenn in dem Dateiname „Kopie von Kopie von…“ steht: maximal Dateilänge des Dateisystems beachten.
 
Zuletzt bearbeitet:
Ich verstehe die Frage ehrlich gesagt nicht? Ein Fehler tritt dann auf, wenn das was kopiert wird, also die Quelle, fehlerhaft ist und das ist entweder durch Datenträgerdefekt oder korruptes Dateisystem möglich. Ansonsten kannst du so viel und oft kopieren wie du willst, der Inhalt bleibt doch gleich? Eine Datei die ohne Datenträgerkorruption vor 40 Jahren angelegt wurde ist nach einer Kopie heute genau gleich dem Original, auch wenn sie in der Zwischenzeit 100000 mal auf andere Datenträger gesichert worden wäre.
 
  • Gefällt mir
Reaktionen: Terrier
1. Ist nicht nur der Datenträger zu betrachten, beim kopieren/verschieben sind auch CPU und RAM beteiligt. Wenn kein ECC-RAM verwendet wird, kann es theoretisch jeder Zeit zu einem Bitflip kommen. Das war's dann.

2. Kommt es auf das Tool an, welches benutzt wird. Der Windows-Explorer ist nicht besonders gut in der Disziplin. Ich benutze seit Jahren den Total Commander (die integrierte Kopierfunktion ist nicht die schnellste, ist aber sehr zuverlässig).

3. Hilft nur ein Integritätscheck (via Hash) um die Unversehrtheit der Kopie zu verifizieren.
 
Also da es sich um eine digitale Kopie handelt unterscheidet sich die Kopie nicht vom Original.
Natürlich kann es beim kopieren zu einem Fehler kommen, das hat aber nichts mit der Anzahl der Kopien zu tun sondern kann jederzeit passieren selbst bei der 1. Kopie.
 
  • Gefällt mir
Reaktionen: Terrier
Uff. Schwierig zu beantworten, weil da viele Faktoren mit reinspielen. Ich würde eher behaupten dass es nicht unbedingt beim Kopieren zu Fehlern kommt, sondern bei längerer Verweildauer von Daten.

Mit anderen Worten: Es ist weniger wahrscheinlich dass es zu Dateifehlern kommt wenn bspw. eine Datei 100.000 mal von einer Festplatte auf eine andere innerhalb eines Jahres kopiert wird, als wenn diese Datei von denselben Platten von einer auf die andere HDD innerhalb von 10 Jahren kopiert wird.

Beim Kopieren selber greifen diverse Mechanismen um sicherzustellen, dass die Einsen und Nullen von Quelle und Ziel identisch sind. Aber wenn eine Datei 10 Jahre auf einer alten HDD rumliegt, steigt die Wahrscheinlichkeit dass einige Einsen oder Nullen aufgrund von Alterserscheinungen "flippen" und dann ist die Datei kaputt und kann auch nicht beim Kopieren repariert werden. Außer die Dateien sind mit einer Form von Parität o.Ä. gespeichert worden.
 
Grundsätzlich können bei jedem kopieren Fehler auftreten. Es können auch einfach in einer bestehenden Datei Fehler entstehen ohne das der Datenträger probleme hätte (siehe SEU).

Es gibt aber heutzutage auch diverse mechanismen um Fehler zu korrigieren. Es gibt allerdings keine sinnvolle Grenze die beschreiben könnte das ab X kopien mit Warscheinlichkeit Y einem Fehler zu rechnen wäre. Das würde von der Grösse und Struktur der Datei sowie dem Datenträger dem Dateisystem und der Kopiermethodik abhängen.

Insofern macht es auch wenig Sinn die qualität einer 1000mal Kopierten Datei geringer einzustufen als die einer gerade erstellten.
 
  • Gefällt mir
Reaktionen: Terrier und t-6
mae1cum77 schrieb:
1. Ist nicht nur der Datenträger zu betrachten, beim kopieren/verschieben sind auch CPU und RAM beteiligt. Wenn kein ECC-RAM verwendet wird, kann es theoretisch jeder Zeit zu einem Bitflip kommen. Das war's dann.
Das ist sehr blauäugig bis falsch.

ECC RAM hilft dir bei Bit-Flips im RAM. Wenn bereits falsch von der HDD eingelesen wird, kann der RAM da gar nix erkennen. ECC ist außerdem nur Korrektur für 1-Bit-Flips und 2-Bit-Erkennung. Sobald also von der HDD gelesen oder auf diese geschrieben wird, wird gar nichts erkannt oder korrigiert, weil die Festplatte hier Murks fabriziert und der RAM damit nichts zu tun hat.
mae1cum77 schrieb:
2. Kommt es auf das Tool an, welches benutzt wird. Der Windows-Explorer ist nicht besonders gut in der Disziplin. Ich benutze seit Jahren den Total Commander (die integrierte Kopierfunktion ist nicht die schnellste, ist aber sehr zuverlässig).
Insofern TC nicht nen Verify mit inkludiert, kann er genau gar nichts besser als der Explorer.
Code:
write( new_hdd, read( old_hdd ) )
mehr macht kein Kopiervorgang und TC und der Explorer sind da vollkommen identisch. Anders siehst es wie gesagt aus, wenn du nen Verify mit anhängst.

@berlyn Eine Kopie ist eine Kopie ist eine Kopie und jede ist identisch. Du kannst Dateien milliardenfach kopieren und sie sind immer noch identisch. Vorausgesetzt keine Komponente beim Kopieren (HDD/SSD, Kabel, Mainboard, RAM, CPU) fabriziert Fehler. Eine modifizierte Kopie ist keine Kopie mehr.

Wenn du prüfen willst, gibts wie bereits gesagt Hashes/Prüfsummen dafür. Unterschiedliche Hashes bedeuten unterschiedliche Daten.

Tools zum Kopieren mit inkludiertem Verify:
 
  • Gefällt mir
Reaktionen: Terrier und tollertyp
Normalerweise sind heutzutage bei allen Übertragungen Fehlerkorrekturen am Start, die notfalls Datenpakete nochmal erneut anfordern, wenn was schief gegangen ist.. Denn Fehler passieren immer und ständig.
Um hohe Geschwindigkeiten überhaupt zu erreichen, ist meist auch eine entsprechend gute Fehlerkorrektur Grundvoraussetzung.

Du kannst ja auch auf ner Internetleitung auf der du packet loss hast (z.B. auch über WLAN bei schlechter Verbindung) problemlos Downloads laufen lassen, ohne dass die Daten die du herunterlädst korrumpiert werden.

Letzten Endes fängt das ganze eben schon auf tiefster Hardwareebene bei der Leitungscodierung an.

Ob man dann am Ende wirklich nochmal manuell nen Chekcsummenvergleich macht, muss jeder selbst entscheiden. Sollte aber eigentlich unnötig sein, wenn der Kopiervorgang erfolgreich war.
 
Zuletzt bearbeitet von einem Moderator:
Null und Einsen kannst du kopieren so oft wie du willst. Es bleiben Nullen und Einsen.
 
Jo, und manchmal kippt irgendwo mal ein Bit. Habe selbst schon erlebt, dass plötzlich einzelne Dateien Fehler aufweisen ohne erkennbaren Grund. Was ziemlich gut dagegen hilft, ist BTRFS. ;)
 
Backups sollen gerüchteweise auch helfen. Da muss man sich dann um gekippte Bits auch weniger Sorgen machen, und noch vor viel anderem auch nicht.
 
 
  • Gefällt mir
Reaktionen: Cool Master
berlyn schrieb:
ich habe eine praktische Frage:
wenn ich eine Datei 100.000mal bis millionen-fach kopiere (also immer KOPIEvonKOPIEvonKOPIE...)

wann treten dann erste Fehler auf?
Real musst Du es ausprobieren, theoretisch kannst Du aus den Angaben der HDD (Bitfehlerrate) die Wahrscheinlichkeit errechnen, wann Fehler auftreten sollten (ohne kosmische Strahlung und sonstiges Zeugs und unter der Annahme, dass Du immer die selbe HDD nutzt).

berlyn schrieb:
wann treten erst Fehler auf? Theoretisch wenn es die 100.000ste Festplatten-KOPIE ist?
Theoretisch bei einem von 10^14 gelesenen Bit, oder bei besseren HDDs auch "nur" bei einem von 10^15 Bit.

Das sind dann gut 113 TB an gelesenen Daten. Kopierst Du also auf einer 14 TB HDD ein 7 TB Image 20 mal, ist die Wahrscheinlichkeit recht hoch, dass bei einer der 20 Kopieraktionen ein Bit nicht korrekt gelesen werden konnte.

berlyn schrieb:
Ich habe jetzt seit 22jahren Dokumente & es gab mit Windows
keinen einzigen sichtbaren Fehler in der Dateistruktur. Videos, Musik & Dokumente immer tadellos.
Sichtbar sagt garnichts, nicht nur Videocodecs sind fehlertolerant. Wenn, dann musst Du Prüfsummen der Orignaldateien anlegen und diese beim Lesen der Dateien mit den kopierten Daten vergleichen.

Der (regelmäßige) Vergleich von zwei Datenbeständen nützt Dir auch nichts, die könnten ja theoretisch ohne Kopieraktion beide an der selben Stelle über die Zeit einen Fehler erhalten.

Jongleur666 schrieb:
Was ziemlich gut dagegen hilft, ist BTRFS. ;)
Das hilft aber auch nicht gegen Fehler, die während dem Kopieren entstehen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: tollertyp
berlyn schrieb:
Wenn ich meine Daten jetzt mit jeder neuen HDD immer weiter verschiebe,
wann treten erst Fehler auf?
Theoretisch wenn es die 100.000ste Festplatten-KOPIE ist?
Das kann doch nur jemand beantworten, der schon mal mit einer solchen Datenmenge hantiert und eine entsprechende Fehlermeldung bekommen hat.
Ich bezweifle, dass es da viele User gibt, die auf solche Ideen kommen und das regelmäßig praktizieren.

Wenn ja, dann werden wohl die entsprechenden Werkzeuge verwendet, zum Beispiel robocopy oder externe, die das halbwegs professionell in die Tat umsetzen können.
 
gymfan schrieb:
Das hilft aber auch nicht gegen Fehler, die während dem Kopieren entstehen.

Doch in Verbindung mit ECC RAM. Nicht vergessen auch eine HDD (und SSD) haben ECC Korrektur.

Ich kann jedem Empfehlen, dass verlinkte Video von @t3chn0 zu schauen. Am Ende vom Tag gibt es keine 100% Sicherheit wenn es um Daten geht.

Zu der ursprünglichen Frage kann man aber sagen, dass es keine Probleme geben sollte selbst nach 100.000 Kopien. Also die Datei wird nicht wegen dem Fakt korrupt, dass sie kopiert wurde sondern weil etwas anderes passiert ist.
 
Also bei einer analogen Kopie wurde die Kopie immer schlechter. Bei einer digitalen Kopie passiert aus elektrischer Sicht erst mal nichts. Man kann sogar aus einem "schlechten" Datenbestand durch Kopieren wieder einen besseren machen. Von einem sterbenden oder schwer lesbaren Laufwerk die Daten runter zu kopieren kopiert ja nur den Inhalt der Daten, nicht aber die Charakteristik des Ausgangslaufwerks beim Lesen - und das ist gut so. Und manche Kopierschutzmechanismen haben teilweise sogar darauf gebaut, dass die sich diese Charakteristik nicht (einfach) kopieren lässt.

Die Frage stellt sich also nicht, wie häufig man eine Sache kopieren muss, bis ein Bitfehler auftritt, sondern eher, wie häufig das generell auftritt. Denn das kann ja auch bereits bei der ersten Kopie entstehen.
 
  • Gefällt mir
Reaktionen: NotNerdNotDau
Zurück
Oben