WulfmanGER
Commander
- Registriert
- Juli 2005
- Beiträge
- 2.317
Hallo zusammen,
leider weiß ich nicht wie dieser Mechanismus heißt - daher der Betreff nicht so toll.
Folgendes:
Ich komprimiere bei 7Zip mit der Stärke ULTRA (ob ich LZMA nutzen muss weiß ich gerade nicht)
Jetzt nehme ich 2 Dateien:
Datei1.JPG (CRC 123)
Datei2.JPG (CRC 123)
Datei 2 ist eine Kopie der 1. Beide Dateien je 10Mbyte groß.
Ich packe ... Das Ergebnis - Datei.7z ist 10,1Mbyte groß. Rar, Zip etc. bringt hier ca. 19,9Mbyte (JPG lassen sich halt schlecht komprimieren)
Was hier passiert ist eigentlich klar: Warum soll man 2 identische Dateien einzeln komprimieren wenn man Verweise/Links auf eine physikalisch existierende setzen kann:
Datei1.jpg => Datei.jpg
Datei2.jpg => Datei.jpg
Im Zusammenhang mit irgendeinem Dateisystem hab ich von gleichem System gelesen (ich meine jetzt nicht händisch erstellte Links - das ist was ganz anderes!). Lösche ich Datei2.jpg wird nur der Link zu Datei.jpg aufgelöst. Lösche ich dann Datei1.jpg wird der Link aufgelöst und erkannt: Datei.jpg hat keine verweise mehr => löschen.
Egal - weiter:
Jetzt nehme ich zwei völlig unterschiedliche Dateien
Datei 3.jpg = 10 Mbyte (CRC 382)
Datei 4.jpg = 10 Mbyte (CRC 184)
Ich packe -> Datei2.7z => 20Mbyte ... hab ich erwartet! JPG - mies komprimierbar!
Jetzt nehme ich diese 4 Dateien und erstelle das Archiv Datei_neu.7z. Ergebnis: 40Mbyte ... komprimierte Größe: ca. 39Mbyte ....
Warum?
Datei1.7z (Datei1, Datei2) = 10,1Mbyte
Datei2.7z (Datei3, Datei4) = 20Mbyte
Datei_neu.7z (Datei1,2,3,4) = 40Mbyte und nicht 30,1Mbyte. Warum klappt der Mechanismus, der in Datei1.7z, wirkt nur wenn 2 Dateien enthalten sind, aber nicht bei 4?
Das muss ja ein Grund haben. Dateiintegrität?
Grüße
PS: ich kann es leider gerade nicht testen - ich meine ZIP könnte das aber auch - höchste Komprimierung, LZMA usw.
leider weiß ich nicht wie dieser Mechanismus heißt - daher der Betreff nicht so toll.
Folgendes:
Ich komprimiere bei 7Zip mit der Stärke ULTRA (ob ich LZMA nutzen muss weiß ich gerade nicht)
Jetzt nehme ich 2 Dateien:
Datei1.JPG (CRC 123)
Datei2.JPG (CRC 123)
Datei 2 ist eine Kopie der 1. Beide Dateien je 10Mbyte groß.
Ich packe ... Das Ergebnis - Datei.7z ist 10,1Mbyte groß. Rar, Zip etc. bringt hier ca. 19,9Mbyte (JPG lassen sich halt schlecht komprimieren)
Was hier passiert ist eigentlich klar: Warum soll man 2 identische Dateien einzeln komprimieren wenn man Verweise/Links auf eine physikalisch existierende setzen kann:
Datei1.jpg => Datei.jpg
Datei2.jpg => Datei.jpg
Im Zusammenhang mit irgendeinem Dateisystem hab ich von gleichem System gelesen (ich meine jetzt nicht händisch erstellte Links - das ist was ganz anderes!). Lösche ich Datei2.jpg wird nur der Link zu Datei.jpg aufgelöst. Lösche ich dann Datei1.jpg wird der Link aufgelöst und erkannt: Datei.jpg hat keine verweise mehr => löschen.
Egal - weiter:
Jetzt nehme ich zwei völlig unterschiedliche Dateien
Datei 3.jpg = 10 Mbyte (CRC 382)
Datei 4.jpg = 10 Mbyte (CRC 184)
Ich packe -> Datei2.7z => 20Mbyte ... hab ich erwartet! JPG - mies komprimierbar!
Jetzt nehme ich diese 4 Dateien und erstelle das Archiv Datei_neu.7z. Ergebnis: 40Mbyte ... komprimierte Größe: ca. 39Mbyte ....
Warum?
Datei1.7z (Datei1, Datei2) = 10,1Mbyte
Datei2.7z (Datei3, Datei4) = 20Mbyte
Datei_neu.7z (Datei1,2,3,4) = 40Mbyte und nicht 30,1Mbyte. Warum klappt der Mechanismus, der in Datei1.7z, wirkt nur wenn 2 Dateien enthalten sind, aber nicht bei 4?
Das muss ja ein Grund haben. Dateiintegrität?
Grüße
PS: ich kann es leider gerade nicht testen - ich meine ZIP könnte das aber auch - höchste Komprimierung, LZMA usw.