Hi Leute
Ich habe mir ein Skript geschreiben, welches für eingegebene Worter eine Suchmaschinenanfrage stellt und dann mit hilfe von regular expressions die anzahl der ergebnisse herausfiltern soll.
Das funktioniert an sic auch wunderbar.
NUR:
Obwohl ich den gleichen User Agent sende, den auch mein Firefox sendet hat die zurückgelieferte html seite ungleich weniger ergebnisse als wenn man die seite mit einem Browser direkt öffnet. Kann mir aber nicht erklären warum.
Verwende Perl mit dem LWP Modul
MfG Thomas
Perlscript und LWP
-
- Beiträge: 65
- Registriert: 16.07.2004 12:35:31
- Wohnort: Karlsfeld
-
Kontaktdaten:
- godsmacker
- Beiträge: 902
- Registriert: 16.03.2003 21:50:26
- Lizenz eigener Beiträge: Artistic Lizenz
- Wohnort: Chemnitz
-
Kontaktdaten:
-
- Beiträge: 65
- Registriert: 16.07.2004 12:35:31
- Wohnort: Karlsfeld
-
Kontaktdaten:
Hi godsmacker
das Problem hat sich erledigt
Verwundernswert ist, dass Google und co bei unterschiedlichen headern andere ergebnisse senden.
Wenn ich in meinem Skript den Accept-Enctype auf gzip,deflate setze und nach der anfrage die Seite decomprimiere habe ich die gleiche zahl wie im browser ( load balancing bei google ?) naja es läuft auf jeden fall
das mit WWW:: Search kommt für mich leider nicht in frage, da icn nur die Zahlen haben will und WWW::Search nicht alle Suchmaschienen unterstützt welche ich ablesen wollte (Gutenberg.spiegel.de, ...)
Aber danke für den Tip kann ich bei anderen sachen super einsetzten.
MfG Thomas
das Problem hat sich erledigt
Verwundernswert ist, dass Google und co bei unterschiedlichen headern andere ergebnisse senden.
Wenn ich in meinem Skript den Accept-Enctype auf gzip,deflate setze und nach der anfrage die Seite decomprimiere habe ich die gleiche zahl wie im browser ( load balancing bei google ?) naja es läuft auf jeden fall
das mit WWW:: Search kommt für mich leider nicht in frage, da icn nur die Zahlen haben will und WWW::Search nicht alle Suchmaschienen unterstützt welche ich ablesen wollte (Gutenberg.spiegel.de, ...)
Aber danke für den Tip kann ich bei anderen sachen super einsetzten.
MfG Thomas