doppelte datein finden

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Thoeoyi
Beiträge: 198
Registriert: 30.03.2004 12:49:11
Lizenz eigener Beiträge: GNU General Public License

doppelte datein finden

Beitrag von Thoeoyi » 19.08.2005 11:32:37

Ich suche ein prgramm das doppelt datein ausfindig macht. Ich möchte mal ordentlich aufräumen und hab teilweise sehr wie doppelt und dreifach *g*

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 19.08.2005 11:35:49

Hi,

eine Frage die sich in dem zusammenhang stellt:
Ist doppelt für dich gleicher Inhalt und/oder gleicher Name?
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Thoeoyi
Beiträge: 198
Registriert: 30.03.2004 12:49:11
Lizenz eigener Beiträge: GNU General Public License

Beitrag von Thoeoyi » 19.08.2005 11:37:07

gleicher inhalt.... bzw gleicher inhalt + name...

mir gehts besonders um den gleichen inhalt

Benutzeravatar
finupsen
Beiträge: 1327
Registriert: 21.04.2004 20:07:05
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Beitrag von finupsen » 19.08.2005 12:14:52

hallo,

das ist bestimmt nicht einfach. Man müsste ja quasi jede datei mit jeder
datei vergleichen , also alles rekursiv abklappern. Dazu müsste man von
jeder datei ein md5-hash erzeugen, was bei großen dateien sehr lange
dauert.

Ein programm wüsste ich jetzt nicht, aber ein shellscript wäre sicherlich
möglich. Die frage ist nur, ob sich der aufwand lohnt. Von daher würd
ich das schon per hand machen ... es sei denn es handelt sich um
mehrere millionen dateien ;)

MfG
Niemand hat vor eine zentrale Datensammelbehörde aufzubauen. Es handelt sich vielmehr um dezentrale IT-Systeme die miteinander vernetzt werden.
... und Wasser ist naß.

Thoeoyi
Beiträge: 198
Registriert: 30.03.2004 12:49:11
Lizenz eigener Beiträge: GNU General Public License

Beitrag von Thoeoyi » 19.08.2005 12:38:21

genau handelt es sich um 2153 files in 182 verzeichnisen ;)

Benutzeravatar
vicbrother
Beiträge: 1016
Registriert: 23.12.2001 11:15:07
Wohnort: Hamburg

Beitrag von vicbrother » 19.08.2005 12:41:58

Code: Alles auswählen

 find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > doppelte.asc 
Quelle: http://debiananwenderhandbuch.de/arbeit ... teien.html

oder

Code: Alles auswählen

 aptitude install fdupes 
Debian GNU/Linux "unstable" + KDE4 @ Dell Precision M6400
T9600 - 4GB RAM - 2x160GB RAID0 - nVIDIA Quadro FX 3700M - 17" WUXGA RGB LED - Webcam - Backlit Keyboard - UMTS - 9 Cell Battery -

Benutzeravatar
finupsen
Beiträge: 1327
Registriert: 21.04.2004 20:07:05
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Beitrag von finupsen » 19.08.2005 13:03:38

[quote="vicbrother"]

Code: Alles auswählen

 find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > doppelte.asc 
... bin immer wieder erstaunt wie leistungfähig und einfach ein shellscript sein kann...

nicht schlecht herr specht ;)
Niemand hat vor eine zentrale Datensammelbehörde aufzubauen. Es handelt sich vielmehr um dezentrale IT-Systeme die miteinander vernetzt werden.
... und Wasser ist naß.

Benutzeravatar
striker2150
Beiträge: 158
Registriert: 23.07.2004 20:46:22

Re: doppelte datein finden

Beitrag von striker2150 » 23.09.2013 17:20:27

Das Script hier könnte vielleicht helfen:
http://it-fuzzy.blogspot.de/2010/08/che ... ouble.html

Antworten