Hallo an alle;
hat jemand bitte etwas Erfahrung mit Volltextsuche in grossen Datenmengen? Hat jemand vielleicht Rat hinsichtlich einer guten Vorgehensweise:
- Einem faellt natuerlich zunaechst die Variante ein, jegliches Dateiformat in *txt zu verwandeln und dann mit grep zu durchsuchen.
- Ich sage ja nicht, dass es besser ist, unter Windoofs gibt es eine Datenbank namens AskSam, die integriert fuer die Volltextsuche alle moeglichen Formate.
- Wie handhabt man nun das Problem in grossen Datenmengen bestmoeglich suchen zu koennen? Was empfiehlt Ihr? Gibt es DIE Optimalloesung? Volltextsuche ist mir das Wichtigste.
Und als relationale Datenbank, kann da auch eine Bestloesung empfohlen werden?
Vielen, herzlichen Dank fuer alle Ratschlaege im voraus.
Gruss, Dirk
Volltextsuche und Relationale datenbak
- northernstar
- Beiträge: 431
- Registriert: 10.09.2008 19:29:20
- Wohnort: Harz
Volltextsuche und Relationale datenbak
Linux, GNU, Debian is... so much more than an OS... it' s when people stick together, an invincible community... just call it quality.
- ckoepp
- Beiträge: 1409
- Registriert: 11.06.2005 20:11:23
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Nähe Heidelberg
Re: Volltextsuche und Relationale datenbak
Volltextsuche an sich ist unheimlich schlecht und wird daher so gut wie nie eingesetzt.
Und genau aus diesem Grund ist Google auch so erfolgreich
Die haben die weltweit besten Algorithmen um genau diese Volltextsuche zu vermeiden und die Suche damit effizient zu machen.
Schau dir mal die Datenbankstruktur von wbb und phpbb (oder beliebige Forensoftware) an, die lösen das ja - zugegeben nicht sehr schön, aber immerhin ohne Volltextsuche - im Umfeld relationaler Datenbanken.
Und genau aus diesem Grund ist Google auch so erfolgreich
Die haben die weltweit besten Algorithmen um genau diese Volltextsuche zu vermeiden und die Suche damit effizient zu machen.
Schau dir mal die Datenbankstruktur von wbb und phpbb (oder beliebige Forensoftware) an, die lösen das ja - zugegeben nicht sehr schön, aber immerhin ohne Volltextsuche - im Umfeld relationaler Datenbanken.
"Es gibt kein Problem, das man nicht mit einem doppelten Scotch lösen könnte!"
Ernest Hemingway
Ernest Hemingway
- northernstar
- Beiträge: 431
- Registriert: 10.09.2008 19:29:20
- Wohnort: Harz
Re: Volltextsuche und Relationale datenbak
Vielen Dank ! Ich werde mir das mal genauer anschauen. Thanxxxx!!
Linux, GNU, Debian is... so much more than an OS... it' s when people stick together, an invincible community... just call it quality.
Re: Volltextsuche und Relationale datenbak
wäre beagle bzw. strigi nix für dich?
Re: Volltextsuche und Relationale datenbak
was sind grosse Datenmengen fuer dich? Ein paar Megabyte? Oder Terabyte?in grossen Datenmengen
Re: Volltextsuche und Relationale datenbak
Hallo Northerstar,
es gibt leistungsfähige Produkte zur Volltextsuche.
Schau dich mal im Bereich des Dokumentenmanagement um.
Verity ist einer der Klassiker (inzwischen von Autonomy übernommen).
Aber auch Oracle hat seit fast 10 Jahren eine Volltextfunktionalität.
Da du auch nach relationalen Datenbanken gefragt hattest daher vielleicht ein Hinweis wert.
Ich persönlich benutze MySql
@ckoepp,
Gruß
Dirk
es gibt leistungsfähige Produkte zur Volltextsuche.
Schau dich mal im Bereich des Dokumentenmanagement um.
Verity ist einer der Klassiker (inzwischen von Autonomy übernommen).
Aber auch Oracle hat seit fast 10 Jahren eine Volltextfunktionalität.
Da du auch nach relationalen Datenbanken gefragt hattest daher vielleicht ein Hinweis wert.
Ich persönlich benutze MySql
@ckoepp,
Bitte definiere Volltextsuche!Die haben die weltweit besten Algorithmen um genau diese Volltextsuche zu vermeiden und die Suche damit effizient zu machen.
Gruß
Dirk
- northernstar
- Beiträge: 431
- Registriert: 10.09.2008 19:29:20
- Wohnort: Harz
Re: Volltextsuche und Relationale datenbak
Hallo an alle!
Ich freue mich sehr ueber Eure schoenen Antworten. Sehr vielen Dank!
- Tja, ich denke wir reden ueber Terabyte, ich stelle mir die Datenmenge in der Datenbank einer ueberregionalen Zeitung oder die eines BKA z.B. vor. Und, wenn ich mich richtig erinnere, war die Loesung der Windoofs Welt fuer die Beispiele oben die Ask Sam Datenbank. In der konnte man z.B. eine Boolsche Suche starten fuer Begriffe "in einem Text", ich meine auch "in einem Absatz" oder "in einem Satz". Und ich frage mich nun vor allem, ob jemand mit exzellenter Beherrschung des Betriebssystems, hier insbes. ein Debian-Linux, die Aufgabe besser erledigen koennte, vielleicht mit einer besseren/anderen Datenbank. Ob derjenige die Aufgabe besser erledigen koennte als eine "Fertigloesung" wie Ask Sam, aus der Windoofs Welt.
Aber die Antworten von Euch helfen mir garantiert sehr weiter. Ich muss mich da in die Sache einarbeiten. Es ist nicht leider so, dass ich die Begriffe immer kenne, und wenn ich einen kenne, wie Oracle, dann kenne ich die Datenbank eben nicht genau... also hier muss jemand ein wenig arbeiten
Nochmals, sehr herzlichen Dank und viele Gruesse an alle!
Dirk
Ich freue mich sehr ueber Eure schoenen Antworten. Sehr vielen Dank!
- Tja, ich denke wir reden ueber Terabyte, ich stelle mir die Datenmenge in der Datenbank einer ueberregionalen Zeitung oder die eines BKA z.B. vor. Und, wenn ich mich richtig erinnere, war die Loesung der Windoofs Welt fuer die Beispiele oben die Ask Sam Datenbank. In der konnte man z.B. eine Boolsche Suche starten fuer Begriffe "in einem Text", ich meine auch "in einem Absatz" oder "in einem Satz". Und ich frage mich nun vor allem, ob jemand mit exzellenter Beherrschung des Betriebssystems, hier insbes. ein Debian-Linux, die Aufgabe besser erledigen koennte, vielleicht mit einer besseren/anderen Datenbank. Ob derjenige die Aufgabe besser erledigen koennte als eine "Fertigloesung" wie Ask Sam, aus der Windoofs Welt.
Aber die Antworten von Euch helfen mir garantiert sehr weiter. Ich muss mich da in die Sache einarbeiten. Es ist nicht leider so, dass ich die Begriffe immer kenne, und wenn ich einen kenne, wie Oracle, dann kenne ich die Datenbank eben nicht genau... also hier muss jemand ein wenig arbeiten
Nochmals, sehr herzlichen Dank und viele Gruesse an alle!
Dirk
Linux, GNU, Debian is... so much more than an OS... it' s when people stick together, an invincible community... just call it quality.