[gelöst] Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
-
- Beiträge: 723
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
[gelöst] Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Ich habe hier die Archive einer von Mailman verwalteten Mailingliste, 123 Textdateien mit vielen hundert Mails. Leider habe ich keinen Zugriff auf die mbox-Archive, in denen Mailman seine Archive speichert, sondern habe per wget die öffentlich zugänglichen Archive heruntergeladen. Das sind eigentlich auch mbox-Dateien (die einfache Variante - ohne Größenangaben für die Mails), allerdings sind alle Mails vor dem Bot-Zugriff "geschützt": aus foo@bar.com wird "foo at bar.com".
Das so in Evolution oder Thunderbird zu importieren, ist nicht optimal - nicht nur, dass ich so nicht nach Mail-Adressen suchen kann, Evolution gerät teilweise auch durcheinander und produziert teils aberwitzige Mailadressen oder Absendernamen.
Gibt es eine fertige Lösung, das maschinell zu "reparieren"? Also bspw. in Zeilen, die mit "From" oder "From:" beginnen, "<Space>at<space>" durch ein "@" zu ersetzen?
Das so in Evolution oder Thunderbird zu importieren, ist nicht optimal - nicht nur, dass ich so nicht nach Mail-Adressen suchen kann, Evolution gerät teilweise auch durcheinander und produziert teils aberwitzige Mailadressen oder Absendernamen.
Gibt es eine fertige Lösung, das maschinell zu "reparieren"? Also bspw. in Zeilen, die mit "From" oder "From:" beginnen, "<Space>at<space>" durch ein "@" zu ersetzen?
Zuletzt geändert von Korodny am 19.08.2018 23:10:19, insgesamt 1-mal geändert.
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Jo, einfach sed verwenden. Die regulären Ausdrücke kannst auf regex101.com testen/lernen.
Edit: der Aufwand für sed hält sich wirklich in Grenzen, aber falls du fertig-fertig wolltest: nein.
Edit: der Aufwand für sed hält sich wirklich in Grenzen, aber falls du fertig-fertig wolltest: nein.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
-
- Beiträge: 5629
- Registriert: 30.12.2004 15:31:07
- Wohnort: Wegberg
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Hallo
Du kannst die textdatei auch in Libreoffice-Writer laden udn dann Suchen und Ersetzen aufrufen und es damit versuchen.
mfg
schwedenmann
Du kannst die textdatei auch in Libreoffice-Writer laden udn dann Suchen und Ersetzen aufrufen und es damit versuchen.
mfg
schwedenmann
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Eine (möglicherweise sehr große) plaintext-Datei in einem (größtmöglichsten) richtext-Editor öffnen, um dessen "suchen und ersetzen" zu verwenden?schwedenmann hat geschrieben:18.08.2018 17:38:04Du kannst die textdatei auch in Libreoffice-Writer laden udn dann Suchen und Ersetzen aufrufen und es damit versuchen.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
-
- Beiträge: 5629
- Registriert: 30.12.2004 15:31:07
- Wohnort: Wegberg
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Hallo
@TRex
Außerdem hat der TE die größe afaik nicht erwähnt.
Diese Methode ist afaik schneller als sed, wenn das damit nciht klappt, kann man ja immer noch auf sed zurückgreifen.
mfg
schwedenmann
@TRex
Käme auf einen Versuch, nicht alle Editoren, oder Textverarbeitungsprogramme machen bei 1GB großen Dateien schlappEine (möglicherweise sehr große) plaintext-Datei in einem (größtmöglichsten) richtext-Editor öffnen, um dessen "suchen und ersetzen" zu verwenden?
Außerdem hat der TE die größe afaik nicht erwähnt.
Diese Methode ist afaik schneller als sed, wenn das damit nciht klappt, kann man ja immer noch auf sed zurückgreifen.
mfg
schwedenmann
-
- Beiträge: 723
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Es geht um 123 Textdateien, die werde ich sicher nicht einzeln bearbeiten.
Ja, ich kenne sed natürlich, stehe aber mit RegExps eher auf Kriegsfuß. Dachte jemand hat vielleicht eine Anregung wie das umzusetzen ist.
Ja, ich kenne sed natürlich, stehe aber mit RegExps eher auf Kriegsfuß. Dachte jemand hat vielleicht eine Anregung wie das umzusetzen ist.
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Ja, nennt sich awk, und sieht in etwa so aus:Korodny hat geschrieben:18.08.2018 16:42:52Gibt es eine fertige Lösung, das maschinell zu "reparieren"? Also bspw. in Zeilen, die mit "From" oder "From:" beginnen, "<Space>at<space>" durch ein "@" zu ersetzen?
Code: Alles auswählen
awk '/^From/{gsub(" at ", "@"); print $0; next} {print }' datei
-
- Beiträge: 3290
- Registriert: 29.06.2013 17:32:10
- Lizenz eigener Beiträge: GNU General Public License
-
Kontaktdaten:
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Code: Alles auswählen
sed '/^From: /s/ at /@/'
(=_=)
Unsere neue Mutter: https://www.nvidia.com/de-de/data-center/a100/
Unsere neue Mutter: https://www.nvidia.com/de-de/data-center/a100/
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Es gibt einen Editor, der in Datei sucht und eventuell auch so alle ersetzt,
https://foicica.com/textadept/
bluefish kann direkt in allen Dateien in einen Rutsch ersetzen. Solange es nicht gelungen ist, die originale alte Dateien immer abgesichert halten.
https://foicica.com/textadept/
bluefish kann direkt in allen Dateien in einen Rutsch ersetzen. Solange es nicht gelungen ist, die originale alte Dateien immer abgesichert halten.
Systemd und PulseAudio, hmmm, nein danke.
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
_jeder_ Editor kann das, der ein bisschen komplexer ist als mousepad... und der kanns vermutlich auch.Revod hat geschrieben:19.08.2018 17:29:22Es gibt einen Editor, der in Datei sucht und eventuell auch so alle ersetzt,
Ich würde ja noch die anderen hundert Editoren nennen...
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
-
- Beiträge: 723
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: Textbearbeitung: "foo at bar.com" wieder in maschinenlesbare Adressen wandeln?
Vielen Dank für die TIpps, hab's jetzt mit dem sed-Vorschlag von inne gelöst, das war exakt das was ich gesucht habe.