Hallo,
neulich hat Firefox einen eigenen Drucker-Dialog anstelle des System-Drucker-Dialogs unausweichlich eingeführt, was die Ausgabe bzw. das Speichern von Webseiten als PDF-Datei durch mehrere Mausklicks aufwendig macht.
Gibt es eventuell eine praktische Befehls-Option, bei der ich einfach am Ende des Befehls die Webseite-Adresse, die ausgedruckt werden soll, einfügen kann?
Die Situationsanwendung ist für das Sammeln von Artikeln aus der Webseite gedacht, was besonders für Lehrer und Forscher nützlich ist. Man hat auf der Festplatte ein bestimmtes Verzeichnis, wo die gewollten Artikeln als PDF abgelegt werden sollen.
Dabei ist es wichtig, dass man Artikeln aus verschiedenen Webseiten entprechend als PDF holen kann. Besonders interessant ist es, wenn Artikel aus einseitigen Nachrichtenanstalten wie z.B. Deutschlandfunk https://www.deutschlandfunk.de/nachrichten-100.html somit gesichert werden könnten, denn sie verändern oder löschen selektiv deren Nachrichten je nach politischen Entscheidungen, sodass nachträglich jedes Nachschlagen verhindert bzw. ein unrealistisches Ergebnis bringt. Auf der anderen Seite, sollen Artikel entsprechend erfasst werden, die von Denker anderer Kulturen verfasst wurden, wie diese aus der Welt Abya Yalas https://www.telesurtv.net/bloggers/La-U ... -0003.html
Mit welchen Befehlen kann ich solche Inhalte als PDF auf meine Festplatte ablegen?
Ich bedanke mich bei Euch im vorraus für jeden Tipp!
Viele Grüße
Dengo
Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen
Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen
das geht z.B. mit wkhtmltopdf auf der console:
Speichert die angegebene Webseite als test.pdf im aktuellen Verzeichnis.
Bei Firefox gibt es ein Add-On "Save as PDF", soll wohl mit einem Kick gehen, hab ich aber nicht ausprobiert...
Code: Alles auswählen
wkhtmltopdf https://irgendwas.irgendwo/seite.html test.pdf
Bei Firefox gibt es ein Add-On "Save as PDF", soll wohl mit einem Kick gehen, hab ich aber nicht ausprobiert...
- Blue
- Beiträge: 1554
- Registriert: 13.05.2016 12:42:18
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen
@Dengo:
- "printer-driver-cups-pdf" und "cups" installieren
- den "PDF-Drucker" unter den Drucker-Einstellungen hinzufügen, wenn dies nicht schon automatisch passiert ist
- bei Eingriffen in das System ist es btw immer sinnvoll, ein Reboot oder Ab- und wieder Anmelden vorzunehmen, damit die Änderungen wirksam werden
- eine Webseite öffnen und aus dem Browser heraus einen Druckauftrag als PDF geben
- die Seite wird dann nicht tatsächlich ausgedruckt, sondern erscheint als PDF-Datei unter dem Ordner "PDF" im Home-Verzeichnis
Im Gegensatz zu der oben erwähnten alternativen Möglichkeit über das Browser-Add-On "save as pdf" gehen die Daten mit der printer-driver-cups-pdf-Methode nicht an eine Konvertierungs-Seite im Web, sondern werden im eigenen PC verarbeitet, will sagen es herrscht mehr Datenschutz und Privatheit.
Die oben dargestellte Konsolenlösung wiederum entspricht imho nicht dem Wunsch nach einer schnellen und einfachen Methode.
BTW:
Nützlich ist es imho auch, das Browser-Add-On "SingleFile" zu installieren.
Dies ermöglicht das Abspeichern einer Web-Seite als eine einzige HTML-Datei:
https://www.youtube.com/watch?v=RdV8DBW5b0g
Beide Verfahren (PDF-Printer / SingleFile) nutze ich, wie auch vom Threadstarter anvisiert, zum Archivieren mir wichtiger Informationen aus dem Internet.
Zumindest bei mir (Debian-Stable / Gnome3-Wayland / Firefox-Esr) läuft das dann so:Webseiten als PDF-Datei... ausgeben lassen
- "printer-driver-cups-pdf" und "cups" installieren
- den "PDF-Drucker" unter den Drucker-Einstellungen hinzufügen, wenn dies nicht schon automatisch passiert ist
- bei Eingriffen in das System ist es btw immer sinnvoll, ein Reboot oder Ab- und wieder Anmelden vorzunehmen, damit die Änderungen wirksam werden
- eine Webseite öffnen und aus dem Browser heraus einen Druckauftrag als PDF geben
- die Seite wird dann nicht tatsächlich ausgedruckt, sondern erscheint als PDF-Datei unter dem Ordner "PDF" im Home-Verzeichnis
Im Gegensatz zu der oben erwähnten alternativen Möglichkeit über das Browser-Add-On "save as pdf" gehen die Daten mit der printer-driver-cups-pdf-Methode nicht an eine Konvertierungs-Seite im Web, sondern werden im eigenen PC verarbeitet, will sagen es herrscht mehr Datenschutz und Privatheit.
Die oben dargestellte Konsolenlösung wiederum entspricht imho nicht dem Wunsch nach einer schnellen und einfachen Methode.
BTW:
Nützlich ist es imho auch, das Browser-Add-On "SingleFile" zu installieren.
Dies ermöglicht das Abspeichern einer Web-Seite als eine einzige HTML-Datei:
https://www.youtube.com/watch?v=RdV8DBW5b0g
Beide Verfahren (PDF-Printer / SingleFile) nutze ich, wie auch vom Threadstarter anvisiert, zum Archivieren mir wichtiger Informationen aus dem Internet.
Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen
Vielen Dank für die Tipps.
Inzwischen habe ich sie getestet und sie funktionieren, auch wenn ich noch nicht genau weiß, was für meinen Zweck verwendet wird.
Die Addons habe ich installiert und verwendet. Anschließend Firefox geschoßen. Dabei habe ich etwas festgestellt, das ich bisher, soweit meine Erinnerung reicht, noch nie gesehen habe: unter den anschließend noch laufenden Prozessen befinden sich folgende, die eigentlich nicht da sein sollten:
28075 dengo 20 0 4054688 434832 140296 S 1,0 2,7 129:41.25 firefox-esr
28199 dengo 20 0 26,9g 298464 86800 S 0,3 1,8 9:09.16 WebExtensions
28158 dengo 20 0 2449228 98884 72456 S 0,3 0,6 1:25.36 Web Content
Auch nachdem ich Debian 11 (Mate, Thinkpad x220i) schlafen machte und wieder aufweckte, blieben die Prozesse aktiv. Alle zwei Addons wieder deinstalliert, alle Programme geschlossen, System heruntergefahren und wieder hoch. Dann waren diese Prozesse nicht mehr da. Firefox geöffnet und nach einer Minute wieder geschlossen, nun laufen trotzdem die drei aufgelisteten Prozesse fleißig weiter. Ich kann nicht nachvollziehen, was sie nachträglich noch zu tun hätten.
killall findet keinen Prozess, obwohl die angegebene Prozess-Nummer stimmt. Mit kill -9 können sie beendet werden.
Ich werde es weiter beobachten und basteln, und womöglich nach weitere möglichen Lösungen suchen.
Viele Grüße
dengo
Inzwischen habe ich sie getestet und sie funktionieren, auch wenn ich noch nicht genau weiß, was für meinen Zweck verwendet wird.
Die Addons habe ich installiert und verwendet. Anschließend Firefox geschoßen. Dabei habe ich etwas festgestellt, das ich bisher, soweit meine Erinnerung reicht, noch nie gesehen habe: unter den anschließend noch laufenden Prozessen befinden sich folgende, die eigentlich nicht da sein sollten:
28075 dengo 20 0 4054688 434832 140296 S 1,0 2,7 129:41.25 firefox-esr
28199 dengo 20 0 26,9g 298464 86800 S 0,3 1,8 9:09.16 WebExtensions
28158 dengo 20 0 2449228 98884 72456 S 0,3 0,6 1:25.36 Web Content
Auch nachdem ich Debian 11 (Mate, Thinkpad x220i) schlafen machte und wieder aufweckte, blieben die Prozesse aktiv. Alle zwei Addons wieder deinstalliert, alle Programme geschlossen, System heruntergefahren und wieder hoch. Dann waren diese Prozesse nicht mehr da. Firefox geöffnet und nach einer Minute wieder geschlossen, nun laufen trotzdem die drei aufgelisteten Prozesse fleißig weiter. Ich kann nicht nachvollziehen, was sie nachträglich noch zu tun hätten.
killall findet keinen Prozess, obwohl die angegebene Prozess-Nummer stimmt. Mit kill -9 können sie beendet werden.
Ich werde es weiter beobachten und basteln, und womöglich nach weitere möglichen Lösungen suchen.
Viele Grüße
dengo
Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen
Das ist verständlich, denn das kann so nicht sein. Ich würde mal tippen, dass du da irgenein Aktualisierungsproblem in deiner Prozessanzeige hattest. Wenn du firefox beendest, dann beenden sich auch der WebExtenssions- und alle Web Content-Prozesse. Der Addon-Ersatz WebExtensions und die verschiedenen Tabs (WebContent) laufen in neueren Versionen von Firefox in eigenen Prozessen, die von Firefox erzeugt werden. Es gibt einen Firefox-, einen WebExtensions- und mindestens einen Web Content-Prozess (maximal so viele, wie unter Setings/General/Performance/Content_process_limit eingestellt ist)Dengo hat geschrieben:16.05.2022 19:14:01Firefox geöffnet und nach einer Minute wieder geschlossen, nun laufen trotzdem die drei aufgelisteten Prozesse fleißig weiter. Ich kann nicht nachvollziehen, was sie nachträglich noch zu tun hätten.
Das liegt vielleicht daran, dass killall mit dem Prozessnamen aufgerufen wird und kill mit der PID. Im obigen Beispiel beendet also sowohlkillall findet keinen Prozess, obwohl die angegebene Prozess-Nummer stimmt. Mit kill -9 können sie beendet werden.
Code: Alles auswählen
kill 28075
Code: Alles auswählen
killall firefox-esr