Perlscript und LWP

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
BloodyNewbie
Beiträge: 65
Registriert: 16.07.2004 12:35:31
Wohnort: Karlsfeld
Kontaktdaten:

Perlscript und LWP

Beitrag von BloodyNewbie » 07.07.2005 08:40:46

Hi Leute

Ich habe mir ein Skript geschreiben, welches für eingegebene Worter eine Suchmaschinenanfrage stellt und dann mit hilfe von regular expressions die anzahl der ergebnisse herausfiltern soll.

Das funktioniert an sic auch wunderbar.

NUR:

Obwohl ich den gleichen User Agent sende, den auch mein Firefox sendet hat die zurückgelieferte html seite ungleich weniger ergebnisse als wenn man die seite mit einem Browser direkt öffnet. Kann mir aber nicht erklären warum.
Verwende Perl mit dem LWP Modul

MfG Thomas

Benutzeravatar
godsmacker
Beiträge: 902
Registriert: 16.03.2003 21:50:26
Lizenz eigener Beiträge: Artistic Lizenz
Wohnort: Chemnitz
Kontaktdaten:

Beitrag von godsmacker » 07.07.2005 18:33:58

Das Problem kann ich mangels des Skripts nicht reproduzieren. Aber eigentlich brauchst Du um mit diversen Suchmaschinen in Perl zu arbeiten nicht selbst mit LWP rumzuhantieren. Es gibt WWW::Search (und WWW::Search::Google). Fuer Debian Benutzer gibt's das mit libwww-search-perl.

Gruesse,
Flo

BloodyNewbie
Beiträge: 65
Registriert: 16.07.2004 12:35:31
Wohnort: Karlsfeld
Kontaktdaten:

Beitrag von BloodyNewbie » 07.07.2005 19:23:29

Hi godsmacker

das Problem hat sich erledigt

Verwundernswert ist, dass Google und co bei unterschiedlichen headern andere ergebnisse senden.

Wenn ich in meinem Skript den Accept-Enctype auf gzip,deflate setze und nach der anfrage die Seite decomprimiere habe ich die gleiche zahl wie im browser ( load balancing bei google ?) naja es läuft auf jeden fall :)

das mit WWW:: Search kommt für mich leider nicht in frage, da icn nur die Zahlen haben will und WWW::Search nicht alle Suchmaschienen unterstützt welche ich ablesen wollte (Gutenberg.spiegel.de, ...)

Aber danke für den Tip kann ich bei anderen sachen super einsetzten.

MfG Thomas

Antworten