Indexserverartige Suchmaschine für Lenny
Indexserverartige Suchmaschine für Lenny
Hallo zusammen,
ich habe hier einen Fileserver auf dem ca. 300 GB Texte, Quellcodes und andere Dokumente liegen in den Formaten PDF, DOC, ODT, TXT, RTF, SVG usw.
Gibt es eine Suchmaschine, die über ein Webinterface zu bedienen ist und diese Formate inidzieren kann ?
Im Wesentlichen wie der Indexserver nur besser und für Linux.
Ciao
Matze
ich habe hier einen Fileserver auf dem ca. 300 GB Texte, Quellcodes und andere Dokumente liegen in den Formaten PDF, DOC, ODT, TXT, RTF, SVG usw.
Gibt es eine Suchmaschine, die über ein Webinterface zu bedienen ist und diese Formate inidzieren kann ?
Im Wesentlichen wie der Indexserver nur besser und für Linux.
Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */
- Mr_Snede
- Beiträge: 2323
- Registriert: 08.07.2003 13:48:49
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Ruhrpott
Re: Indexserverartige Suchmaschine für Lenny
Auf Anhieb fallen mir einige indexer ein, bzw habe sie per herausgesucht (gerade an nem ubuntu 8.10):
--> http://projects.gnome.org/tracker/ --> http://www.mail-archive.com/tracker-lis ... 03098.html
--> http://wiki.ubuntuusers.de/Beagle
--> http://de.wikipedia.org/wiki/Strigi
[EDIT]--> http://strigi.sourceforge.net/?q=links
In wie weit Webinterfaces vorhanden sind müsstest du selbst mal rausfinden. Ansonsten kann man wohl einige auch direkt per Konsole bedienen. Ich kann mir durchaus vorstellen, dass die Suchmaschinen auch remote von eine Desktopoberfläche benutzbar sind.
Oder halt die Platten lokal einbinden und dann halt die Indexer drüber laufen lassen.
Code: Alles auswählen
apt-cache search index
--> http://projects.gnome.org/tracker/ --> http://www.mail-archive.com/tracker-lis ... 03098.html
--> http://wiki.ubuntuusers.de/Beagle
--> http://de.wikipedia.org/wiki/Strigi
[EDIT]--> http://strigi.sourceforge.net/?q=links
In wie weit Webinterfaces vorhanden sind müsstest du selbst mal rausfinden. Ansonsten kann man wohl einige auch direkt per Konsole bedienen. Ich kann mir durchaus vorstellen, dass die Suchmaschinen auch remote von eine Desktopoberfläche benutzbar sind.
Oder halt die Platten lokal einbinden und dann halt die Indexer drüber laufen lassen.
Software Finder - Software in Kategorien Debian ohne Ballast - Tipps für ein schlankes Debian
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: Indexserverartige Suchmaschine für Lenny
google-desktop?
Code: Alles auswählen
darko@bitch:~$ nmap localhost -p 33288
Starting Nmap 4.62 ( http://nmap.org ) at 2009-02-11 15:19 CET
Interesting ports on localhost (127.0.0.1):
PORT STATE SERVICE
33288/tcp open unknown
Nmap done: 1 IP address (1 host up) scanned in 0.101 seconds
darko@bitch:~$
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
Re: Indexserverartige Suchmaschine für Lenny
hi,
schön wäre irgendwas was Out-of-the-box den Job macht, das Einrichten der Filter, die später dann die verschiedenen Dateiformate zerlegen scheint mir mächtig kompliziert.
Wir hatten eine zeitlang etwas lucene basiertes im Einsatz, aber das Konfigurieren und ewige Nachziehen der verschiedenen benötigten Pakete zieht sich wie Kaugumme. Das Ding wurde zur Wartungsleiche.
Schön wäre was komfortables
google-desktop klingt zwar vielversprechend, aber haben die dann nicht wieder seltsame Lizenzmodelle ?
Ciao
Matze
schön wäre irgendwas was Out-of-the-box den Job macht, das Einrichten der Filter, die später dann die verschiedenen Dateiformate zerlegen scheint mir mächtig kompliziert.
Wir hatten eine zeitlang etwas lucene basiertes im Einsatz, aber das Konfigurieren und ewige Nachziehen der verschiedenen benötigten Pakete zieht sich wie Kaugumme. Das Ding wurde zur Wartungsleiche.
Schön wäre was komfortables
![Smile :-)](./images/smilies/icon_smile.gif)
Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: Indexserverartige Suchmaschine für Lenny
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
Re: Indexserverartige Suchmaschine für Lenny
Hi,
wie schätzt du diesen Hinweis von Wikipedia ein ?
Ciao
Matze
wie schätzt du diesen Hinweis von Wikipedia ein ?
Das klingt ja nicht so, als ob man damit die Daten eines kleinen Firmenintranet indizieren sollte finde ich.Datenschützer warnen vor der Suchfunktion über mehrere Rechner, die schon Version 3 von Google Desktop anbot. Bei dieser Funktion wird der Suchindex über die Dokumente, die sich auf dem eigenen Rechner befinden, auf zentralen Servern von Google gespeichert. Damit könnten z. B. Ermittlungsbehörden oder Regierungen leicht Zugriff auf private Dokumente bekommen. Für Dateien auf einem Server gelten in den USA geringere Datenschutzbestimmungen als für den Zugriff auf einen PC.
Auch wenn diese Funktionen ausgeschaltet sind, sendet Google Desktop eine eindeutige ID an Google, mit der sich theoretisch alle Daten, wie getätigte Suchen, besuchte Webseiten (über Google Analytics) und mehr, miteinander verknüpfen lassen und umfangreiche Nutzerprofile angelegt werden können.
Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: Indexserverartige Suchmaschine für Lenny
Und wenn man das Protokoll in der Firewall sperrt?
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
Re: Indexserverartige Suchmaschine für Lenny
Hi,
zu heiß. Outbound Traffic wird kaum gefiltert und wenn einer der Admins Mist baut bin ich wieder schuld![Wink ;)](./images/smilies/icon_wink.gif)
Sonst muss ich mein steinaltes UNI Projekt auspacken und es damit versuchen.
Ciao
Matze
zu heiß. Outbound Traffic wird kaum gefiltert und wenn einer der Admins Mist baut bin ich wieder schuld
![Wink ;)](./images/smilies/icon_wink.gif)
Sonst muss ich mein steinaltes UNI Projekt auspacken und es damit versuchen.
Ciao
Matze
/* OS: Squeeze / Wheezy / Jessie auf amd64/i386/ARM */