Doppelte Dateien finden

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Arrpork
Beiträge: 111
Registriert: 25.02.2004 13:42:17

Doppelte Dateien finden

Beitrag von Arrpork » 29.12.2007 14:33:24

Hallo,

kennt jemand von euch ein Tool, welches auf der gesamten Platte bei beispielsweise 10000 Dateien (eventuell anhand md5, Grösse, etc.) geiche Dateien findet.

Das einzige Tool mit dieser Funktion ist meines Wissens nach duff.

Gruß Arrpork

Benutzeravatar
GoKi
Beiträge: 2068
Registriert: 04.07.2003 23:08:56
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von GoKi » 29.12.2007 14:57:13

Mir fällt da spontan noch
http://packages.debian.org/etch/fdupes
ein
MfG GoKi
:wq

Benutzeravatar
Duff
Beiträge: 6321
Registriert: 22.03.2005 14:36:03
Wohnort: /home/duff

Beitrag von Duff » 29.12.2007 16:42:30

Interessantes Packet. Das kannte ich noch nicht.
Oh, yeah!

guennid

Beitrag von guennid » 29.12.2007 20:50:09

fslint

Grüße, Günther

Da_Hamster
Beiträge: 23
Registriert: 24.11.2007 20:18:09
Wohnort: NRW

Beitrag von Da_Hamster » 30.12.2007 00:52:51

duff könnte das sein, was du suchst ;)

http://duff.sourceforge.net/

Geier0815
Beiträge: 361
Registriert: 07.04.2005 16:51:01

Beitrag von Geier0815 » 30.12.2007 19:23:48

Tooltipp von Linux-Magazin 10/07 heißt Weedit, als Alternativen werden noch Dupseek, Duper und Fdupe genannt.
Weedit durchsucht auf Basis von MD5 und CRC-32 und legt auf Wunsch eine Dupplettendatenbank an. Praktisch habe ich es bisher aber auch noch nicht getestet. http://adm1n.cjb.net/cw/ ist wohl die Homepage dort findest Du auch den Artikel vom L-M.
Wenn Windows die Lösung ist...
kann ich dann bitte das Problem zurück haben?

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 30.12.2007 21:02:22

Hi,

Code: Alles auswählen

find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D > doppelte.asc
sollte es auch "tun".
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Benutzeravatar
Duff
Beiträge: 6321
Registriert: 22.03.2005 14:36:03
Wohnort: /home/duff

Beitrag von Duff » 31.12.2007 10:45:25

Auch eine sehr gute Lösung. Back to the roots ;-)

Jetzt müsste man nur noch mal mit time die Zeit messen, um zu schauen, was performanter ist.
Oh, yeah!

roli
Beiträge: 3174
Registriert: 10.09.2003 17:39:58

Beitrag von roli » 31.12.2007 11:32:56

Duff hat geschrieben:Auch eine sehr gute Lösung. Back to the roots ;-)
"Besser is das"
Duff hat geschrieben:Jetzt müsste man nur noch mal mit time die Zeit messen, um zu schauen, was performanter ist.
Dann denk aber drann das die Gleichung "real=user+system" nicht immer aufgeht. Das liegt wiederum daran, das user und system mittels clock() ermittelt werden, und real mittels gettimeofday(). Ich zweifele auch immer mal wieder an meinen Rechenkuensten, wenn's mal wieder nicht passt, wobei es ja nicht zwangsweise nicht passen muss. Wenn du jetzt noch eine "Mehrkern" Maschine dein eigen nennst, dann spielt auch die Anzahl der Kerne eine Rolle.
Roland


"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"

Antworten