Dateien von der ÖNB bequem herunterladen
-
- Beiträge: 79
- Registriert: 02.04.2005 14:31:57
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Genf
-
Kontaktdaten:
Dateien von der ÖNB bequem herunterladen
Hallo zusammen!
Ich stehe vor folgendem Problem: Die österreichische Nationalbibliothek hat einige alte Manuskripte gescannt und ins Internet gestellt, siehe z.B. hier. Wenn man auf der verlinkten Seite auf "Digitalisat" klickt, öffnet sich ein neues Fenster, welches dann jeweils eine Seite des Manuskripts anzeigt. Wenn man nun alle Seiten auf seinem Rechner speichern will (um z.B. auch offline Zugang zu haben), kann man leider nur Seite für Seite durchgehen und händisch abspeichern, da es keine globale Download-Option gibt und die Dateinamen der Bilder auch keinem einfachen Schema folgen. Meine Frage ist nun, ob es irgendeine Möglichkeit gibt, die Dateien trotzdem einfach und bequem herunterzuladen (rechtlich sollte das kein Problem sein, schließlich sind die mich interessierenden Manusckripte ja alle ca. 300 Jahre alt).
Ich stehe vor folgendem Problem: Die österreichische Nationalbibliothek hat einige alte Manuskripte gescannt und ins Internet gestellt, siehe z.B. hier. Wenn man auf der verlinkten Seite auf "Digitalisat" klickt, öffnet sich ein neues Fenster, welches dann jeweils eine Seite des Manuskripts anzeigt. Wenn man nun alle Seiten auf seinem Rechner speichern will (um z.B. auch offline Zugang zu haben), kann man leider nur Seite für Seite durchgehen und händisch abspeichern, da es keine globale Download-Option gibt und die Dateinamen der Bilder auch keinem einfachen Schema folgen. Meine Frage ist nun, ob es irgendeine Möglichkeit gibt, die Dateien trotzdem einfach und bequem herunterzuladen (rechtlich sollte das kein Problem sein, schließlich sind die mich interessierenden Manusckripte ja alle ca. 300 Jahre alt).
-
- Beiträge: 5635
- Registriert: 30.12.2004 15:31:07
- Wohnort: Wegberg
Re: Dateien von der ÖNB bequem herunterladen
Hallo
Was ist senn du in deinem link auf digisat gehst und dann diese URL per wget runterlädst, incl. weiterer Seiten (Optionen von wgat für sowas müßtest du googeln), geht afaik auch per aria2, oder anstatt wget httrack verwendest ?
mfg
schwedenmann
Was ist senn du in deinem link auf digisat gehst und dann diese URL per wget runterlädst, incl. weiterer Seiten (Optionen von wgat für sowas müßtest du googeln), geht afaik auch per aria2, oder anstatt wget httrack verwendest ?
mfg
schwedenmann
-
- Beiträge: 79
- Registriert: 02.04.2005 14:31:57
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Genf
-
Kontaktdaten:
Re: Dateien von der ÖNB bequem herunterladen
Ich habe es nun mit wget probiert:
Das lädt mir dann einige Dateien herunter. Wenn ich diese öffne, erkenne ich grob das wieder, was ein Klick auf Digitalisat liefern würde. Problem ist aber, daß von den jpegs die dann auch auftauchen sollte, weit und breit keine Spur ist. Ein Blick in die Quelltexte der php- und JavaScript-Dateien erhellt mich auch kein Stück.
Code: Alles auswählen
wget -r --referer='http://aleph.onb.ac.at/F/7NH117C1MN83K28KUN2H7DR9Q5QCVSC8VRER4E7LQD1XED27KG-01111?func=full-set-set&set_number=009884&set_entry=000007&format=999' 'http://archiv.onb.ac.at:1801/webclient/DeliveryManager?pid=3050247&custom_att_2=simple_viewer'
- spiralnebelverdreher
- Beiträge: 1298
- Registriert: 23.12.2005 22:29:03
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Frankfurt am Main
Re: Dateien von der ÖNB bequem herunterladen
Vielleicht kann dir Frau Magister C. Müller, Leiterin der Abteilung Digitale Service (christa.mueller@onb.ac.at) deine Frage beantworten.Boccaccio hat geschrieben:Hallo zusammen!
Ich stehe vor folgendem Problem: Die österreichische Nationalbibliothek hat einige alte Manuskripte gescannt und ins Internet gestellt. Meine Frage ist nun, ob es irgendeine Möglichkeit gibt, die Dateien trotzdem einfach und bequem herunterzuladen (rechtlich sollte das kein Problem sein, schließlich sind die mich interessierenden Manusckripte ja alle ca. 300 Jahre alt).
Re: Dateien von der ÖNB bequem herunterladen
Mich auch nicht. Wenn ich die Bilder aber nun unbedingt haben wollte und hier keine bessere Lösung kommt, würde ich den Browsercache leeren, mich durch die Bilderserie durchklicken und die Bilder dann mit einer find-file-Kombination aus dem Cache ausfiltern.Boccaccio hat geschrieben:Ein Blick in die Quelltexte der php- und JavaScript-Dateien erhellt mich auch kein Stück.
-
- Beiträge: 79
- Registriert: 02.04.2005 14:31:57
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Genf
-
Kontaktdaten:
Re: Dateien von der ÖNB bequem herunterladen
@spiralnebel
Im Prinzip mag das sein. Leider habe ich in der Vergangenheit die Erfahrung gemacht, daß Bibliotheken ein seltsames Verhältnis zu ihren Digitalisaten haben und einem Download sehr feindlich gegenüber stehen. Das vermute ich auch hier, da man ja sonst einfach eine Pdf-Datei zur Verfügung hätte stellen können oder die jpeg-Dateien systematisch File001 bis File999 hätte benennen können. Aber wenn ich mit wget nicht ans Ziel gelange, werde ich mich wohl auch mal per Mail an die ÖNB wenden.
@phineas
Für ein Werk mit 300 Seiten ist das ja schon sehr mühselig, da es aber gleich mehrere Werke gibt, die mich interessieren und die alle ähnlichen Umfang haben, dürfte das nicht sehr praktikabel sein.
Im Prinzip mag das sein. Leider habe ich in der Vergangenheit die Erfahrung gemacht, daß Bibliotheken ein seltsames Verhältnis zu ihren Digitalisaten haben und einem Download sehr feindlich gegenüber stehen. Das vermute ich auch hier, da man ja sonst einfach eine Pdf-Datei zur Verfügung hätte stellen können oder die jpeg-Dateien systematisch File001 bis File999 hätte benennen können. Aber wenn ich mit wget nicht ans Ziel gelange, werde ich mich wohl auch mal per Mail an die ÖNB wenden.
@phineas
Für ein Werk mit 300 Seiten ist das ja schon sehr mühselig, da es aber gleich mehrere Werke gibt, die mich interessieren und die alle ähnlichen Umfang haben, dürfte das nicht sehr praktikabel sein.
Re: Dateien von der ÖNB bequem herunterladen
Diese mit 135 beginnende Nummer in den Bildern wird der Timestamp sein, an dem das Bild in die Datenbank eingepflegt wurde. Daher sind die auch nicht in einer aufsteigenden oder sonstwie nachvollziehbar geordneten Reihenfolge. Das Javascript-Monstrum auf der Seite ist eine einzige undebugbare Sache fuer sich. Vielleicht haben sie das eingesehen und deswegen gerade den Server abgedreht oder ich habe mit meinen einsamen Anfragen deren IDS getriggert... ich bekomme jedenfalls keine Verbindung mehr zustande.
Gruss Cae
Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.
—Bruce Schneier
- spiralnebelverdreher
- Beiträge: 1298
- Registriert: 23.12.2005 22:29:03
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Frankfurt am Main
Re: Dateien von der ÖNB bequem herunterladen
Ja, Behörden und öffentliche Institutionen haben leider manchmal ein seltsames Verhältnis zu ihrem Auftrag (Informationen aufbewahren und Informationen vermitteln). Ich habe da schon sehr unterschiedliche Erfahrungen gemacht.Boccaccio hat geschrieben:@spiralnebel
Im Prinzip mag das sein. Leider habe ich in der Vergangenheit die Erfahrung gemacht, daß Bibliotheken ein seltsames Verhältnis zu ihren Digitalisaten haben und einem Download sehr feindlich gegenüber stehen.
Ich denke, es ist aber auf jeden Fall wichtig, diesen Institutionen unser Ansprüche nach offenem Zugang deutlich zu machen und wenn sie sich quer stellen, auch mal an ihren gesetzlichen Auftrag zu erinnern. Eine freundliche Mail kostet nicht viel Zeit, ist in Teilen wiederverwendbar und die Chance auf Hilfe ist besser als 1:10. Und solche Rückmeldungen sind auch intern für diejenigen Mitarbeiter hilfreich, die dem Anliegen offen gegenüber stehen. Weil das interne Standardargument dagegen ist ja oft: Könnte man machen, ist aber Aufwand und braucht das überhaupt jemand?
Re: Dateien von der ÖNB bequem herunterladen
Ja, das sehe ich ein. Dann fällt mir nur noch ein, den Browser-Vorgang mit Shellscript und "xvkbd -text" (Tastenkürzel für Mausaktionen des Desktops benutzen) zu automatisieren. So etwas habe ich schon öfter gemacht, es funktioniert also. Vielleicht kennt auch Jemand ein besseres Tool als xvkbd.Boccaccio hat geschrieben:@phineas
Für ein Werk mit 300 Seiten ist das ja schon sehr mühselig, da es aber gleich mehrere Werke gibt, die mich interessieren und die alle ähnlichen Umfang haben, dürfte das nicht sehr praktikabel sein.
-
- Beiträge: 79
- Registriert: 02.04.2005 14:31:57
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Genf
-
Kontaktdaten:
Re: Dateien von der ÖNB bequem herunterladen
So, gerade eben gab es eine Rückmeldung aus Österreich. Im wesentlichen schrieb man mir, daß die ÖNB sowohl urheberrechtlich geschützte und ungeschützte Dateien hat und man nicht in der Lage ist zu steuern, daß der Download nur bei ungeschützten Werken möglich ist. Die Dateibenennung war für den Workflow der Digitalisierung so zwingend erforderlich und sollte nicht direkt einen automatisierten Download verhindern. In den kommenden Monaten ist jedoch die Umstellung auf ein neues System geplant und dabei soll dann auch geprüft werden, ob man einen Download anbieten kann.
Fazit: Im Prinzip hat man wohl nichts gegen den Download...nur hat man dort nicht verstanden wie das Internet funktioniert
Ich hatte mittlerweile mal einen detaillierteren Blick ins das ganze JavaScript-Zeugs auf den Digitalisat-Seiten geworfen, aber das ist leider komplett unverständlich für mich
Fazit: Im Prinzip hat man wohl nichts gegen den Download...nur hat man dort nicht verstanden wie das Internet funktioniert
Ich hatte mittlerweile mal einen detaillierteren Blick ins das ganze JavaScript-Zeugs auf den Digitalisat-Seiten geworfen, aber das ist leider komplett unverständlich für mich