"Compare/Sync"-Tools die auch wirklich nach Inhalt vergleichen können?!

flipsns

Lieutenant
Registriert
Okt. 2004
Beiträge
535
Hallo!

Bin recht genervt, weil ich eigentlich gedacht hätte, die Sache wäre rasch erledigt. Habe 2 Ordner mit teilweise identischen Dateien, jedoch unterschiedlichen Dateinamen. Genau diese Dateien wollte ich mir mal mit Hilfe eines Tools anzeigen lassen (und bei Bedarf die Doppelten rauslöschen). Ausprobiert habe ich FreeFileSync und Toucan mit 2 Probeordnern.

Ironischerweise kann man bei FreeFileSync sogar noch auswählen, ob nach Dateinamen und Zeit oder Inhalt verglichen wird. Also wähle ich Vergleich nach "File Content" und was tut er....na er zeigt mir bitte an, dass auf beiden Seiten unterschiedliche Dateien sein sollen! Und dreisterweise sind die Dateigrößen im Anzeigefenster aber identisch! Also für die Tonne!

Bei Toucan dasselbe! Egal welche Optionen ich für den Vergleich wähle, die Dateein werden mir immer als unterschiedlich ausgewiesen.

Wenn ich als Gegenprobe die Dateinamen gleichsetze werden von beiden Programmen die Dateien als "gleich" erkannt! Ja schön, aber dafür brauch ich natürlich kein "Compare/Sync"-Tool!? Sowas kann ich auch selbst erkennen!

Irgendjemand gute Vorschläge?
 

Anhänge

  • freefilesync.jpg
    freefilesync.jpg
    81,1 KB · Aufrufe: 388
Zuletzt bearbeitet:
Ja, in den Sync Tools wird Primär nach Namen synchronisiert. Die Extra Option nach Inhalt vergleichen ist eher eine Performance-Schraube, damit das Tool sich nicht einfach auf geändertes Datum verlässt, sondern nochmal explizit den Inhalt vergleicht.

Aber beantworte bitte mal folgende Frage: Was soll ein Sync-Tool bitte auch tun mit doppelten Dateien? Lautlos löschen? Dann ist da leider nix synchron.
Was du machen solltest ist mit einem Dupletten-Sucher vorher dein Verzeichnis zu bereinigen, anschließend syncen. Tools dafür gibts sicher wie Sand am Meer, Notfalls selbst erledigen mit einem PowerShell-Skript und Md5-Summen.

P.S.: Mir würde da eher sogar noch vorschweben, dass Sync-Tools es Optional so machen, dass doppelte Dateien im Zielordner als relativer Hardlink angelegt werden. Wäre platzsparend. Mach doch mal einen Vorschlag an die entsprechenden Entwickler von FreeFileSync etc.
 
Zuletzt bearbeitet:
DaZpoon schrieb:
Aber beantworte bitte mal folgende Frage: Was soll ein Sync-Tool bitte auch tun mit doppelten Dateien? Lautlos löschen? Dann ist da leider nix synchron.

Na keinesfalls soll es selbständig was tun. Hab ich aber auch gar nicht beanstandet?! Ich wünsch mir lediglich, dass mir so ein Tool nur mal, korrekterweise, (Inhalts-)identische Dateien, auch als solche ausweist, egal ob gleicher Dateiname oder nicht. Das konnte keines dieser Tools. Habe jetzt gerade noch ein Drittes getestet ("DirComp") welches die Option anbietet, einen "Binärvergleich" durchzuführen! Auch das hat nur die Datei mit identischem Dateinamen als identisch identifiziert!

DaZpoon schrieb:
Was du machen solltest ist mit einem Dupletten-Sucher vorher dein Verzeichnis zu bereinigen,

Na genau das will ich ja?! Wenn du sowas kennst, nur her damit. Selber programmieren kann ich nicht. Bin kein Informatiker.
 
Schon einmal mit einer eigenen Batch-Datei versucht mit Windows Bordmitteln?

Hier kannst du dann alles so machen, wie du es haben willst ;)

"fc" wäre dann hier der Kommandoeilenbefehl.
 
Gabbadome schrieb:
Schon einmal mit einer eigenen Batch-Datei versucht mit Windows Bordmitteln?

Hier kannst du dann alles so machen, wie du es haben willst ;)

"fc" wäre dann hier der Kommandoeilenbefehl.

Müsst mich da erst einarbeiten. Na wenn´s nix fertiges mit GUI gibt, eventuell. Aber ich befürcht ich werd´s manuell machen. Da bin ich vermutlich schneller fertig, bevor ich mich in Kommandozeilenbefehle einarbeiten muss und dann eventuell erstrecht Blödsinn (wie zB. Dateiverlust) entsteht.
 
Die Arbeit machst du dir einmal und dann läuft das Programm genau so wie du es möchtest.

Dein Wissen kannst du dann auch nutzen, um noch mehr Automationsroutinen zu erstellen :p
 
Hallo flipsns,
flipsns schrieb:
Ironischerweise kann man bei FreeFileSync sogar noch auswählen, ob nach Dateinamen und Zeit oder Inhalt verglichen wird. ... Also für die Tonne!

Wenn ich als Gegenprobe die Dateinamen gleichsetze werden von beiden Programmen die Dateien als "gleich" erkannt! Ja schön, aber dafür brauch ich natürlich kein "Compare/Sync"-Tool!? Sowas kann ich auch selbst erkennen!
ich muss mich DaZpoon anschließen. Du hast die Funktionsweise von FreeFileSync ein wenig missverstanden.

Stattdessen benötigst Du ein Tool, welches nach doppelten Dateien sucht, wie z.B. CloneSpy oder Anti-Twin. Hier mal ein Einstellungsbeispiel für ClonySpy, welches auf Deine Problemstellung passen könnte:

CloneSpy - Beispiel 01.jpg

Vorsorglich noch ein Hinweis:
ClonySpy arbeitet grundsätzlich sehr zuverlässig, es ermittelt die doppelten Dateien jedoch per Hash-Wert/Prüfsumme und nicht nach Inhalt. Daher besteht in der Theorie eine minimale Fehlerquote.
 
Petronius schrieb:
Vorsorglich noch ein Hinweis:
ClonySpy arbeitet grundsätzlich sehr zuverlässig, es ermittelt die doppelten Dateien jedoch per Hash-Wert/Prüfsumme und nicht nach Inhalt. Daher besteht in der Theorie eine minimale Fehlerquote.

Die Hashsumme wird aus dem kompletten File generiert, so spielt der Inhalt also auch eine Rolle ;)
 
Hallo Gabbadome,
Gabbadome schrieb:
Schon einmal mit einer eigenen Batch-Datei versucht mit Windows Bordmitteln?

Hier kannst du dann alles so machen, wie du es haben willst ;)

"fc" wäre dann hier der Kommandoeilenbefehl.

ich habe hier eine ähnliche Problemstellung wie flipsns, bei der ich mich gerade an einer "individuellen" Lösung versuche. Hättest Du mir da eventuell einen weiteren Ansatz? Leider sind meine Programmierfähigkeiten sehr gering. Was ist "fc" denn für ein Befehl?
 
@Petronius: Solltest du dich nicht mit Programmieren auskennen bzw nur sehr spehrlich, lass die Finger von dieser Aufgabe ;)

Du musst hier mehrere Schleißen ineinander Programmieren und das ist sehr Fehleranfällig. Entweder solltest du eine fertige Lösung nehmen oder dich blind auf jemanden verlassen (das würde ich niemals tun!). Hier hast du dann aber auch Null Ahnung was das Programm wie und warum tut und da es mit deinen Daten hantiert wäre ich hier sehr vorsichtig.

Grundsätzlich ist deine geplante Aktion möglich, ich möchte den Zeitaufwand und die Anforderung an Kenntnissen dafür mal mit Hoch betiteln.

Ich habe leider auch nicht die Zeit, mich diesem Problem anzunehmen.

Der Kommandozeilenbefehl "fc" vergleicht zwei Daten auf ihre Unterschiede. Gebe einmal "fc /?" in einer Konsole ein und der Syntax wird dir erklärt ;)
 
Du hast doch da ein systematisches Problem. In deinem Fall, wo zwei Verzeichnisse identisch sind - bis auf die Dateinamen - ist das alles ja garkein Problem. Aber was tust du jetzt z.B., wenn eine Datei sich unterscheidet. Die beiden Dateien sind dann nicht mehr miteinander verknüpfbar. Das ist nur einer der vielen Cases.
Es fehlt generell bei Dateien eine Identifikationsmöglichkeit über eine eindeutige ID. Auch z.B. Subversion tut sich mit dem Thema umbenennen schwer.

Für deinen Fall würde ich dir raten, dass du die Dateinamen gleich lässt und ein festes Namensmuster verwendest(einfachstenfalls sogar gänzlich frei von freien Bezeichnungen, sondern nur Erstelldatum), dafür die Dateien per MetaDaten filterst. Das unterstützt Windows 7 auch direkt im Explorer.

Eine andere Möglichkeit wäre es, einer Datei ein Attribut zu vergeben was sie eindeutig identifizierbar macht. Das geht unter NTFS mittels "Streams". Aber wenn du die Datei auf ein anderes Dateisystem kopierst sind diese leider weg. Jedoch wäre das die Grundlage für Synchronisierbarkeit abseits von Dateinamenseindeutigkeit.
 
Zuletzt bearbeitet:
Petronius schrieb:
Hallo flipsns,

ich muss mich DaZpoon anschließen. Du hast die Funktionsweise von FreeFileSync ein wenig missverstanden.

Hmm, wird wohl so sein. Aber mir ist ehrlich gesagt immer noch nicht klar, wie man da etwas mißverstehen kann? Freefilesync bietet eindeutig eine "Compare"-Funktion und in den Einstellungen dazu die Option "File time and size" ODER "File Content". Ich empfinde das eigentlich als ziemlich eindeutig?! Aber vielleicht peil ich da echt was nicht.

Petronius schrieb:
Stattdessen benötigst Du ein Tool, welches nach doppelten Dateien sucht, wie z.B. CloneSpy oder Anti-Twin.

Hey, danke! Im ersten Testlauf scheint es das zu sein, was ich gesucht habe!
 
Hi leute, diese Diskussion ist zwar schon einige jährchen alt, aber ich möchte gerne noch meinen Senf hinzu geben und fragen ob es mittlerweile dafür schon ein Lösung gibt.

Ich habe genau das selbe problem mit Toucan und FreFileSync... nur noch eine Spur krasser.

ich habe einen Ordner mit vielen Files drin ( 1100MB ). Diesen Ordner synce ich auf einen USB Stick.
jetzt habe ich dem Ordner einfach einnen neuen Namen verpasst und siehe da mein tolles sync Tool erkennt das als komplett neuen Ordner, obwohl der Inhalt nicht angerührt wurde. Er synct also auf meinen USB stick 2 Ordner mit jeweils 1100 MB.

total bescheuert wenn diese sync tools nicht einmal eine Änderung des Namens erkennen, obwohl der Inhalt mit allen Werten (timestamp, hashwert, filecontent,...) identisch ist.
 
Zurück
Oben