Ordnung ins Fotochaos und Duplikate löschen

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
nivea
Beiträge: 14
Registriert: 16.01.2012 19:17:36

Ordnung ins Fotochaos und Duplikate löschen

Beitrag von nivea » 12.07.2014 18:51:43

Tach,

ich suche kein bestimmtes Programm, sondern das grundsätzliche Vorgehen.

Ich habe meine Fotos verteilt auf mehrere Datenträger (Festplatten, USB-Sticks).
  • Ein Foto kann auf dem selben oder auf unterschiedlichen Datenträger(n) (in unterschiedlichen Ordnern) mehrmals vorhanden sein, unter dem selben Dateinamen oder unter unterschiedlichen Dateinamen.
  • Zwei Fotos welche die selben Dateinamen haben, können vollkommen unterschiedlich sein. Beispiel DSC_0001.jpg
Jetzt doch noch eine Programm-Frage: Womit kann ich das Problem und die Schritte auf dem Weg zur Lösung (Prozess) grafisch darstellen, was würdet ihr da nehmen? Vermutlich alle Alternativen zu MS Visio?

Erste Idee zum Lösungsansatz:
  1. Jeden Datenträger auf dem sich Fotos befinden mit nach jpg und jpeg durchsuchen.
  2. Optional Summe der Datengröße aller Treffer um eine Festplatte mit ausreichend Kapazität auszuwählen.
  3. Alle Treffer von allen Datenträgern auf eine leere Festplatte "B" kopieren. Dabei werden alle Treffer von einem Datenträger in einen eigenen Ordner kopiert.
  4. Die Dateinamen die sich auf der Festplatte B befinden, in jedem Ordner anhand dem Zeitpunkt an dem das Foto gemacht wurde umbenennen Format yy-mm-dd_HH-mm-ss-$urspruenglicherdateiname.jpg (da mehrere bilder pro sekunde aufgenommen worden sein können, auch noch der dateiname mit rein).
    Was mache ich mit den Fotos die gar kein oder ein vollkommen falsches Aufnahmedatum in den EXIF-Daten haben?
  5. Die Fotos anschliessend anhand des Dateinamens in Ordner sortieren, verschachtelt nach Jahr, Monat, Datum.
Ich freue mich über jeden Tipp wo ich was falsch mache / besser machen kann.

Danke,
Merlin

Edit: Passend dazu
http://www.linux-magazine.com/Online/Bl ... Line-Tools

wanne
Moderator
Beiträge: 7581
Registriert: 24.05.2010 12:39:42

Re: Ordnung ins Fotochaos und Duplikate löschen

Beitrag von wanne » 12.07.2014 20:20:57

fdupes findet dir doppelte Datein.
findimagedupes findet dir ähnliche Bilder.

Also:

Code: Alles auswählen

fdupes -r Ordner1 ordner2 ...
Wenn du wirklich nur jpeg von einem datenträger haben willst:

Code: Alles auswählen

echo "3e5dcda9fa5f735ca8093b758f9cc6ff  " > /tmp/imglist
find cworkspace/ -xdev -type f \( -iname "*.jpg" -o -iname "*.jpeg" \) -exec /tmp/imgabgl {} \;> /tmp/rmlist
wobei /tmp/imgabgl folgendes script ist:

Code: Alles auswählen

#!/bin/sh
md5deep -m /tmp/imglist $1
md5sum $1 >> /tmp/imglist
/tmp/rmlist enthällt dann die dateien, die nocheinmal vorkommen.
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
Revod
Beiträge: 3788
Registriert: 20.06.2011 15:04:29
Lizenz eigener Beiträge: MIT Lizenz

Re: Ordnung ins Fotochaos und Duplikate löschen

Beitrag von Revod » 12.07.2014 20:31:47

Wie vorgehen, das ist natürlich je nachdem was für eine Anwendung- Tool dafür benutzen will.

Für Duplikate zu finden arbeite ich mit Krusader (kde4) mit seinen Tool "Ordner vergleichen"

Ein weiteres Tool mit noch mehr funktionen ist FSLint.

Exif kann man man entweder mit Gimp oder XNViewMP bearbeiten (ich würde auch nix anderes dafür nutzen, weil diese 2 Anwendungen ausreichen).

1 bis 3 -Krusader

4 - Krusader oder PyRenamer

5 - So nach Datum habe ich es noch nie sortiert, ich denke Krusader und XFE, letzteres weiss ich genau, es kann auch nach Typen sortieren, da ich für das XFCE mir neue Theme. und Icons erzeugt habe und manchmal wegen den Verknüpfungen sortierte ich es nach Typ.

In wie fern sich gThumb oder Geequi eignen kann ich nicht sagen.

Edit:
Da war noch was, Catfish
Systemd und PulseAudio, hmmm, nein danke.

nivea
Beiträge: 14
Registriert: 16.01.2012 19:17:36

Re: Ordnung ins Fotochaos und Duplikate löschen

Beitrag von nivea » 13.07.2014 20:21:22

Vielen Dank für Eure Antworten.

Code: Alles auswählen

echo "3e5dcda9fa5f735ca8093b758f9cc6ff  " > /tmp/imglist
Hier wird einmalig (oder immer wieder?) der mit echo ausgegebene String in die imglist geschrieben. Ich verstehe nicht wofür.

Code: Alles auswählen

find cworkspace/ -xdev -type f \( -iname "*.jpg" -o -iname "*.jpeg" \) -exec /tmp/imgabgl {} \;> /tmp/rmlist
Super geil. find sucht alle jpg und jpeg (egal ob gross oder klein geschrieben) für jeden Treffer wird der Pfad an das imgabgl-script übergeben und ausgeführt.

Welche Ausgabe wird (wann) in die rmlist geschrieben? Die Ausgabe von find oder gibt es von dem imgabgl-script auch eine Ausgabe die zurückgegeben wird?

Code: Alles auswählen

md5deep -m /tmp/imglist $1
Es wird der md5 von der Datei des in $1 übergebenen Pfad errechnet (?) und mit den md5-summen in imglist verglichen.

Code: Alles auswählen

md5sum $1 >> /tmp/imglist
Die md5-summe von der Datei wird (nochmal?) berechnet und an die imglist angehängt.

Haut das so hin?

Vielen Dank und viel Spaß gleich beim Spiel!

wanne
Moderator
Beiträge: 7581
Registriert: 24.05.2010 12:39:42

Re: Ordnung ins Fotochaos und Duplikate löschen

Beitrag von wanne » 14.07.2014 00:15:27

nivea hat geschrieben:Hier wird einmalig (oder immer wieder?) der mit echo ausgegebene String in die imglist geschrieben. Ich verstehe nicht wofür.
md5deep wird sauer, wenn man ihm eine leere datei gibt. Also habe ich mal eine md5summe reingeschrieben, die garantiert zu keiner datei gehört.
nivea hat geschrieben:Welche Ausgabe wird (wann) in die rmlist geschrieben?
Die des Scriptes. Und das gibt eben die doppelten Dateien aus.
nivea hat geschrieben:Die md5-summe von der Datei wird (nochmal?) berechnet und an die imglist angehängt.

Haut das so hin?
Ja, effizent ist das natürlich ganz und gar nicht. Das problem ist halt, dass man fdupes nicht vernünftig dateilisten übergeben kann.
Sinnvollerweise macht man sowas halt in eine Programmiersprache, die auch andere Datenstrukturen, als Dateien kennt. Aber wenn ich was anderes wie shellcode poste, versteht das ja kein mensch.
Irgend wann hatte ich da mal was in C programmiert, dass dann auch nicht aus prinzip immer über die ganze datei gelaufen ist... Muss mal suchen.

Defakto dürfte es für die meisten sachen wahrscheinlich sogar schneller gehen zuerst fdupes laufen zu lassen und dann nur die jpegs rauszugreppen.
rot: Moderator wanne spricht, default: User wanne spricht.

Antworten