Ein Anwendungsfall ist hier z. B. Postfix:
- Mailsuche nach Absender/Empfänger/Datum/...
- Suche nach Mailproblemen: Häufigkeit gewisser Textpattern (Mailserverblocks)
Ich habe schon ein paar VMs, würde aber schon genauer abwägen, was ich da reinlaufen lassen möchte. Vielleicht Mail-Logs von 10 Mailservern. Und dann von der Menge max. noch das ganze Mal Faktor 5 für andere Logs.
Vor solchen Java-Monstern wie Graylog (mit Elasticsearch) schrecke ich eher etwas zurück. Die Hardwareanforderungen sind da schon enorm.
Meine Motivation ist auch das der grep-Ansatz mit eigenen Scripten schon nervig ist, weil die Suche langsam ist und die Filterung immer wieder erneut bei der Anfrage stattfinden muss. Da hätte ich gerne aufbereitete Daten, die ich schneller durchsuchen kann. Natürlich hätte ich da am liebsten eine OSS-Lösung. Auch würde ich gerne die Robustheit eines Parsing- und Analyseframeworks benutzen. Schön ist es natürlich auch, wenn für Standardsachen da schon Parser da sind, was mir zum einen die Arbeit des selbstschreibens spart und die zum anderen vermutlich einen höhere Qualität haben, als das, was ich selbst zusammengescriptet bekomme.
Ansonsten ist das ein Thema, über das ich auch gerne etwas lernen will, so dass ich es in anderen Umgebungen anwenden kann. D. h. ich will da in einem kleinen Maßstab mit einer Software spielen, die schon auch was taugt.
Octopussy wäre ein Ansatz der etwas leichtgewichtiger ist. Allerdings scheint die Software seit 5 Jahren nicht mehr weiterentwickelt zu werden und so wirklich professionell scheint das ja auch nicht zu sein.
* Habt Ihr da Gedanken dazu?
* Habt Ihr solche Lösungen im Einsatz?
* Was sind da Eure Server-Dimensionierungen dafür?
---
Nachtrag:
Am Beispiel der Anwendung Protokollanalyse Postfix sehe ich dann ja schon, dass ein einfaches zeilenweises einlesen der Logdaten recht nutzlos ist. Da gehören dann ja mehrere Zeilen zusammen. Diese Zeilen bilden dann ein "Event", was dann alle Details enthält, die man da in unterschiedlichen Fällen wissen möchte und nach denen ich suchen können will. Und diese Zeilen sind bei einem sehr beschäftigten Ziel verzahnt ins Logfile geschrieben und werden anhand von Verknüpfungsmerkmalen einander zugeordnet.
Code: Alles auswählen
Jun 21 11:21:01 mailout01 postfix/smtpd[272174]: 2EC40618D3: client=mail.happydomain.de[0.0.0.214]
Jun 21 11:21:01 mailout01 postfix/cleanup[272177]: 2EC40618D3: message-id=<2v12ex3wkpyw8vzaqn4fJHw-ZBYRMax1o2kNngxRQ612f66265e060f44e4a194df@hurz.com>
Jun 21 11:21:01 mailout01 postfix/qmgr[260661]: 2EC40618D3: from=<blablub@hurz.com>, size=178242, nrcpt=1 (queue active)
Jun 21 11:21:01 mailout01 postfix/smtp[272178]: 2EC40618D3: to=<hurz@gmail.com>, relay=gmail-smtp-in.l.google.com[173.194.76.27]:25, delay=0.62, delays=0.02/0.02/0.16/0.42, dsn=2.0.0, status=sent (250 2.0.0 OK 1655810461 y8-20020a056000168800b0021b994aa715si1703191wrd.618 - gsmtp)
Jun 21 11:21:01 mailout01 postfix/qmgr[260661]: 2EC40618D3: removed
- einliefernder Server
- Absender
- Empfänger
- Relay-Host
- Mailgrösse
- relay-status-Nachricht
- delay-Wert des Relays
- Start- und Endedatum des Vorgangs