Folgende sed definitionsdatei habe ich mir zusammengebastelt:
Code: Alles auswählen
#Aufrufen mit:
# sed -f Befehlsdatei zu_bearbeitende_Datei.html
#macht aus <table border="1"> ein einfaches <table>
s/<table[^>]*>/<table>/g
#macht aus <tr "blafasel"> ein einfaches <tr> usw.
s/<tr[^>]*>/<tr>/g
#s/</tr[^>]*>/</tr>/g
s/<td[^>]*>/<td>/g
#s/</td[^>]*>/</td>/g
#macht aus <p "blafasel"> gar nichts, sondern löscht die Zeichenkette.
s/<[/]*p[^>]*>//g
s/<br[^>]*>//g
s/<[/]*div[^>]*>//g
s/<[/]*small[^>]*>//g
s/<[/]*span[^>]*>//g
s/<[/]*big[^>]*>//g
s/<[/]*center[^>]*>//g
s/<[/]*head[^>]*>//g
s/<[/]*meta[^>]*>//g
s/<[/]*body[^>]*>//g
s/<[/]*html[^>]*>//g
s/<![^>]*>//g
Danke für entsprechende hilfe.