Indexserverartige Suchmaschine für Lenny

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Benutzeravatar
barmeier
Beiträge: 358
Registriert: 12.11.2002 17:33:00
Kontaktdaten:

Indexserverartige Suchmaschine für Lenny

Beitrag von barmeier » 09.02.2009 15:41:59

Hallo zusammen,

ich habe hier einen Fileserver auf dem ca. 300 GB Texte, Quellcodes und andere Dokumente liegen in den Formaten PDF, DOC, ODT, TXT, RTF, SVG usw.
Gibt es eine Suchmaschine, die über ein Webinterface zu bedienen ist und diese Formate inidzieren kann ?

Im Wesentlichen wie der Indexserver nur besser und für Linux.

Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */

Benutzeravatar
ThorstenS
Beiträge: 2875
Registriert: 24.04.2004 15:33:31

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von ThorstenS » 10.02.2009 09:59:10


Benutzeravatar
Mr_Snede
Beiträge: 2323
Registriert: 08.07.2003 13:48:49
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Ruhrpott

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von Mr_Snede » 10.02.2009 12:06:36

Auf Anhieb fallen mir einige indexer ein, bzw habe sie per

Code: Alles auswählen

apt-cache search index
herausgesucht (gerade an nem ubuntu 8.10):

--> http://projects.gnome.org/tracker/ --> http://www.mail-archive.com/tracker-lis ... 03098.html
--> http://wiki.ubuntuusers.de/Beagle
--> http://de.wikipedia.org/wiki/Strigi

[EDIT]--> http://strigi.sourceforge.net/?q=links


In wie weit Webinterfaces vorhanden sind müsstest du selbst mal rausfinden. Ansonsten kann man wohl einige auch direkt per Konsole bedienen. Ich kann mir durchaus vorstellen, dass die Suchmaschinen auch remote von eine Desktopoberfläche benutzbar sind.
Oder halt die Platten lokal einbinden und dann halt die Indexer drüber laufen lassen.
Software Finder - Software in Kategorien Debian ohne Ballast - Tipps für ein schlankes Debian

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von minimike » 11.02.2009 15:20:40

google-desktop?

Code: Alles auswählen

darko@bitch:~$ nmap localhost -p 33288

Starting Nmap 4.62 ( http://nmap.org ) at 2009-02-11 15:19 CET
Interesting ports on localhost (127.0.0.1):
PORT      STATE SERVICE
33288/tcp open  unknown

Nmap done: 1 IP address (1 host up) scanned in 0.101 seconds
darko@bitch:~$ 
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
barmeier
Beiträge: 358
Registriert: 12.11.2002 17:33:00
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von barmeier » 11.02.2009 15:52:08

hi,

schön wäre irgendwas was Out-of-the-box den Job macht, das Einrichten der Filter, die später dann die verschiedenen Dateiformate zerlegen scheint mir mächtig kompliziert.

Wir hatten eine zeitlang etwas lucene basiertes im Einsatz, aber das Konfigurieren und ewige Nachziehen der verschiedenen benötigten Pakete zieht sich wie Kaugumme. Das Ding wurde zur Wartungsleiche.

Schön wäre was komfortables :-) google-desktop klingt zwar vielversprechend, aber haben die dann nicht wieder seltsame Lizenzmodelle ?

Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von minimike » 12.02.2009 16:01:08

Hmm, das sieht cool aus, kurz überflogen

http://www.asabox.com/goolag/index_en.htm
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
barmeier
Beiträge: 358
Registriert: 12.11.2002 17:33:00
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von barmeier » 12.02.2009 16:12:01

Hi,

wie schätzt du diesen Hinweis von Wikipedia ein ?
Datenschützer warnen vor der Suchfunktion über mehrere Rechner, die schon Version 3 von Google Desktop anbot. Bei dieser Funktion wird der Suchindex über die Dokumente, die sich auf dem eigenen Rechner befinden, auf zentralen Servern von Google gespeichert. Damit könnten z. B. Ermittlungsbehörden oder Regierungen leicht Zugriff auf private Dokumente bekommen. Für Dateien auf einem Server gelten in den USA geringere Datenschutzbestimmungen als für den Zugriff auf einen PC.

Auch wenn diese Funktionen ausgeschaltet sind, sendet Google Desktop eine eindeutige ID an Google, mit der sich theoretisch alle Daten, wie getätigte Suchen, besuchte Webseiten (über Google Analytics) und mehr, miteinander verknüpfen lassen und umfangreiche Nutzerprofile angelegt werden können.
Das klingt ja nicht so, als ob man damit die Daten eines kleinen Firmenintranet indizieren sollte finde ich.

Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von minimike » 12.02.2009 17:10:59

Und wenn man das Protokoll in der Firewall sperrt?
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
barmeier
Beiträge: 358
Registriert: 12.11.2002 17:33:00
Kontaktdaten:

Re: Indexserverartige Suchmaschine für Lenny

Beitrag von barmeier » 12.02.2009 17:26:52

Hi,

zu heiß. Outbound Traffic wird kaum gefiltert und wenn einer der Admins Mist baut bin ich wieder schuld ;)
Sonst muss ich mein steinaltes UNI Projekt auspacken und es damit versuchen.

Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */

Antworten