ich versuche eine Liste von URLs aus einer Textdatei zu ziehen:
Code: Alles auswählen
cat test.txt | grep -Eo "[https://www.desputin.de/abc/][a-zA-Z0-9./?=_%:-]*.html" | sort -u > OUTPUT-URLs.txt
Viele Grüße desputin
Code: Alles auswählen
cat test.txt | grep -Eo "[https://www.desputin.de/abc/][a-zA-Z0-9./?=_%:-]*.html" | sort -u > OUTPUT-URLs.txt
Code: Alles auswählen
Beispiel https://www.desputin.de/abc/1234.html / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/dddd.html / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/fdfdf.html / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/aaaaaa.html / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/dmc.html / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/dmc.html / grep -x '>.*</li>' input-file / grep -x '>.*</li>' input-file# Beispiel https://www.desputin.de/abc/454545.html
Code: Alles auswählen
$ grep -Eo "[https://www.desputin.de/abc/][a-zA-Z0-9./?=_%:-]*.html" test.txt | sort -u > OUTPUT-URLs.txt && cat OUTPUT-URLs.txt
https://www.desputin.de/abc/1234.html
https://www.desputin.de/abc/454545.html
https://www.desputin.de/abc/aaaaaa.html
https://www.desputin.de/abc/dddd.html
https://www.desputin.de/abc/dmc.html
https://www.desputin.de/abc/fdfdf.html