Mein SQL-Wissen ist auf Schulniveau und auch noch veraltet (Ende der 90er).
Nun bin ich über eine Schulung gestolpert, die SQL im Kontext von Daten-Analyse erwähnt. So richtig erklärt wird es nicht.
Natürlich kann ich bei Daten-Analysen die Daten in einer Datenbank vorhalten, anstatt in Form von CSV Dateien oder ähnlichem. Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?
Hat sich der Standard seit damals, ohne das ich es bemerkt habe, doch weiterentwickelt?
Was könnte dahinter stecken?
[Gelöst] SQL zur Daten-Analyse?
[Gelöst] SQL zur Daten-Analyse?
Zuletzt geändert von buhtz am 12.10.2021 11:06:06, insgesamt 1-mal geändert.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Teil des Upstream Betreuer Teams von Back In Time (backintime)
- paedubucher
- Beiträge: 932
- Registriert: 22.02.2009 16:19:02
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Schweiz
-
Kontaktdaten:
Re: SQL zur Daten-Analyse?
Um Daten analysieren zu können muss man sie zunächst in die richtige Form bringen. Wenn du eine normalisierte relationale Datenbank hast, kannst du mit SQL schon einmal die Daten in die passende Form bringen. Was den Analyseschritt betrifft, bietet SQL (je nach Datenbank) hilfreiche Funktionen, angefangen beim Durchschnitt (mean, median), kann man etwa bei PostgreSQL auch Perzentile usw. berechnen.
Für weitere Schritte nimmt man dann in der Regel die mit SQL aufbereiteten Daten und speichert sie in ein Austauschformat ab; CSV ist da recht beliebt. Sowas liest man dann etwa mit Pandas ein und verarbeitet es mit Python weiter. R ist eine andere Alternative für diesen Schritt, genau wie Julia.
Für weitere Schritte nimmt man dann in der Regel die mit SQL aufbereiteten Daten und speichert sie in ein Austauschformat ab; CSV ist da recht beliebt. Sowas liest man dann etwa mit Pandas ein und verarbeitet es mit Python weiter. R ist eine andere Alternative für diesen Schritt, genau wie Julia.
Habe nun, ach! Java
Python und C-Sharp,
Und leider auch Visual Basic!
Durchaus programmiert mit heissem Bemühn.
Da steh' ich nun, ich armer Tor!
Und bin so klug als wie zuvor.
Python und C-Sharp,
Und leider auch Visual Basic!
Durchaus programmiert mit heissem Bemühn.
Da steh' ich nun, ich armer Tor!
Und bin so klug als wie zuvor.
Re: SQL zur Daten-Analyse?
SQL ist meist auch für komplexere Abfragen recht leistungsfähig und relativ schnell.buhtz hat geschrieben:08.10.2021 16:55:43Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?
Re: SQL zur Daten-Analyse?
Ich mache diese Form von Analysen nicht. Aber bei größeren Datenmengen würde ich wohl die Aktionen im RAM durchführen wollen. Leider weiß ich nicht, ob für sowas Memory-Datenbanken wie redis geeignet sind. Wikipedia Redis
Re: SQL zur Daten-Analyse?
Ja.buhtz hat geschrieben:08.10.2021 16:55:43Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?
Apache Spark würde ich noch in den Ring werfen wollen.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht
Windows ist doof, Linux funktioniert nicht • Don't break debian! • Wie man widerspricht