Dateien von der ÖNB bequem herunterladen

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
Boccaccio
Beiträge: 79
Registriert: 02.04.2005 14:31:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Genf
Kontaktdaten:

Dateien von der ÖNB bequem herunterladen

Beitrag von Boccaccio » 01.01.2013 17:10:50

Hallo zusammen!

Ich stehe vor folgendem Problem: Die österreichische Nationalbibliothek hat einige alte Manuskripte gescannt und ins Internet gestellt, siehe z.B. hier. Wenn man auf der verlinkten Seite auf "Digitalisat" klickt, öffnet sich ein neues Fenster, welches dann jeweils eine Seite des Manuskripts anzeigt. Wenn man nun alle Seiten auf seinem Rechner speichern will (um z.B. auch offline Zugang zu haben), kann man leider nur Seite für Seite durchgehen und händisch abspeichern, da es keine globale Download-Option gibt und die Dateinamen der Bilder auch keinem einfachen Schema folgen. Meine Frage ist nun, ob es irgendeine Möglichkeit gibt, die Dateien trotzdem einfach und bequem herunterzuladen (rechtlich sollte das kein Problem sein, schließlich sind die mich interessierenden Manusckripte ja alle ca. 300 Jahre alt).

schwedenmann
Beiträge: 5646
Registriert: 30.12.2004 15:31:07
Wohnort: Wegberg

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von schwedenmann » 01.01.2013 21:34:09

Hallo


Was ist senn du in deinem link auf digisat gehst und dann diese URL per wget runterlädst, incl. weiterer Seiten (Optionen von wgat für sowas müßtest du googeln), geht afaik auch per aria2, oder anstatt wget httrack verwendest ?

mfg
schwedenmann

Boccaccio
Beiträge: 79
Registriert: 02.04.2005 14:31:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Genf
Kontaktdaten:

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Boccaccio » 01.01.2013 22:41:56

Ich habe es nun mit wget probiert:

Code: Alles auswählen

wget -r  --referer='http://aleph.onb.ac.at/F/7NH117C1MN83K28KUN2H7DR9Q5QCVSC8VRER4E7LQD1XED27KG-01111?func=full-set-set&set_number=009884&set_entry=000007&format=999' 'http://archiv.onb.ac.at:1801/webclient/DeliveryManager?pid=3050247&custom_att_2=simple_viewer'
Das lädt mir dann einige Dateien herunter. Wenn ich diese öffne, erkenne ich grob das wieder, was ein Klick auf Digitalisat liefern würde. Problem ist aber, daß von den jpegs die dann auch auftauchen sollte, weit und breit keine Spur ist. Ein Blick in die Quelltexte der php- und JavaScript-Dateien erhellt mich auch kein Stück.

Benutzeravatar
spiralnebelverdreher
Beiträge: 1298
Registriert: 23.12.2005 22:29:03
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Frankfurt am Main

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von spiralnebelverdreher » 01.01.2013 23:00:03

Boccaccio hat geschrieben:Hallo zusammen!

Ich stehe vor folgendem Problem: Die österreichische Nationalbibliothek hat einige alte Manuskripte gescannt und ins Internet gestellt. Meine Frage ist nun, ob es irgendeine Möglichkeit gibt, die Dateien trotzdem einfach und bequem herunterzuladen (rechtlich sollte das kein Problem sein, schließlich sind die mich interessierenden Manusckripte ja alle ca. 300 Jahre alt).
Vielleicht kann dir Frau Magister C. Müller, Leiterin der Abteilung Digitale Service (christa.mueller@onb.ac.at) deine Frage beantworten.

Benutzeravatar
Phineas
Beiträge: 355
Registriert: 20.06.2012 20:26:19

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Phineas » 01.01.2013 23:05:43

Boccaccio hat geschrieben:Ein Blick in die Quelltexte der php- und JavaScript-Dateien erhellt mich auch kein Stück.
Mich auch nicht. Wenn ich die Bilder aber nun unbedingt haben wollte und hier keine bessere Lösung kommt, würde ich den Browsercache leeren, mich durch die Bilderserie durchklicken und die Bilder dann mit einer find-file-Kombination aus dem Cache ausfiltern.

Boccaccio
Beiträge: 79
Registriert: 02.04.2005 14:31:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Genf
Kontaktdaten:

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Boccaccio » 01.01.2013 23:07:23

@spiralnebel
Im Prinzip mag das sein. Leider habe ich in der Vergangenheit die Erfahrung gemacht, daß Bibliotheken ein seltsames Verhältnis zu ihren Digitalisaten haben und einem Download sehr feindlich gegenüber stehen. Das vermute ich auch hier, da man ja sonst einfach eine Pdf-Datei zur Verfügung hätte stellen können oder die jpeg-Dateien systematisch File001 bis File999 hätte benennen können. Aber wenn ich mit wget nicht ans Ziel gelange, werde ich mich wohl auch mal per Mail an die ÖNB wenden.

@phineas
Für ein Werk mit 300 Seiten ist das ja schon sehr mühselig, da es aber gleich mehrere Werke gibt, die mich interessieren und die alle ähnlichen Umfang haben, dürfte das nicht sehr praktikabel sein.

Cae
Beiträge: 6349
Registriert: 17.07.2011 23:36:39
Wohnort: 2130706433

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Cae » 01.01.2013 23:57:51

Diese mit 135 beginnende Nummer in den Bildern wird der Timestamp sein, an dem das Bild in die Datenbank eingepflegt wurde. Daher sind die auch nicht in einer aufsteigenden oder sonstwie nachvollziehbar geordneten Reihenfolge. Das Javascript-Monstrum auf der Seite ist eine einzige undebugbare Sache fuer sich. Vielleicht haben sie das eingesehen und deswegen gerade den Server abgedreht oder ich habe mit meinen einsamen Anfragen deren IDS getriggert... ich bekomme jedenfalls keine Verbindung mehr zustande.

Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.

—Bruce Schneier

Benutzeravatar
spiralnebelverdreher
Beiträge: 1298
Registriert: 23.12.2005 22:29:03
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Frankfurt am Main

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von spiralnebelverdreher » 02.01.2013 00:01:27

Boccaccio hat geschrieben:@spiralnebel
Im Prinzip mag das sein. Leider habe ich in der Vergangenheit die Erfahrung gemacht, daß Bibliotheken ein seltsames Verhältnis zu ihren Digitalisaten haben und einem Download sehr feindlich gegenüber stehen.
Ja, Behörden und öffentliche Institutionen haben leider manchmal ein seltsames Verhältnis zu ihrem Auftrag (Informationen aufbewahren und Informationen vermitteln). Ich habe da schon sehr unterschiedliche Erfahrungen gemacht.
Ich denke, es ist aber auf jeden Fall wichtig, diesen Institutionen unser Ansprüche nach offenem Zugang deutlich zu machen und wenn sie sich quer stellen, auch mal an ihren gesetzlichen Auftrag zu erinnern. Eine freundliche Mail kostet nicht viel Zeit, ist in Teilen wiederverwendbar und die Chance auf Hilfe ist besser als 1:10. Und solche Rückmeldungen sind auch intern für diejenigen Mitarbeiter hilfreich, die dem Anliegen offen gegenüber stehen. Weil das interne Standardargument dagegen ist ja oft: Könnte man machen, ist aber Aufwand und braucht das überhaupt jemand?

Benutzeravatar
Phineas
Beiträge: 355
Registriert: 20.06.2012 20:26:19

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Phineas » 02.01.2013 00:02:25

Boccaccio hat geschrieben:@phineas
Für ein Werk mit 300 Seiten ist das ja schon sehr mühselig, da es aber gleich mehrere Werke gibt, die mich interessieren und die alle ähnlichen Umfang haben, dürfte das nicht sehr praktikabel sein.
Ja, das sehe ich ein. Dann fällt mir nur noch ein, den Browser-Vorgang mit Shellscript und "xvkbd -text" (Tastenkürzel für Mausaktionen des Desktops benutzen) zu automatisieren. So etwas habe ich schon öfter gemacht, es funktioniert also. Vielleicht kennt auch Jemand ein besseres Tool als xvkbd.

Boccaccio
Beiträge: 79
Registriert: 02.04.2005 14:31:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Genf
Kontaktdaten:

Re: Dateien von der ÖNB bequem herunterladen

Beitrag von Boccaccio » 03.01.2013 15:03:16

So, gerade eben gab es eine Rückmeldung aus Österreich. Im wesentlichen schrieb man mir, daß die ÖNB sowohl urheberrechtlich geschützte und ungeschützte Dateien hat und man nicht in der Lage ist zu steuern, daß der Download nur bei ungeschützten Werken möglich ist. Die Dateibenennung war für den Workflow der Digitalisierung so zwingend erforderlich und sollte nicht direkt einen automatisierten Download verhindern. In den kommenden Monaten ist jedoch die Umstellung auf ein neues System geplant und dabei soll dann auch geprüft werden, ob man einen Download anbieten kann.

Fazit: Im Prinzip hat man wohl nichts gegen den Download...nur hat man dort nicht verstanden wie das Internet funktioniert :?

Ich hatte mittlerweile mal einen detaillierteren Blick ins das ganze JavaScript-Zeugs auf den Digitalisat-Seiten geworfen, aber das ist leider komplett unverständlich für mich :(

Antworten