Erstmal Danke an Alle für die Sachlichtkeit (*ernstmeint*).
r4pt0r hat geschrieben:@MoonKid: Das klingt irgenwie nach einer Auftragsarbeit!? Zudem: Wordcount/-sort ist eigentlich das "hello world" jeder Sprache die sich irgendwie mit "data science" verbunden fühlt bzw in jedem quickstart-manual für frameworks wie Apache Spark... Wenn dann auch noch alternative Lösungen (regex) ausgeschlossen werden bleiben nur noch langweilige/offensichtliche Lösungen z.B. in Scala das für alle Kriterien fertige Funktionen hat (map/flatMap, reduceByKey, count, sort). IMHO nicht wirklich eine Aufgabe für diesen Thread.
"Auftragsarbeit"? Meinst du ich habe den Auftrag bekomme, oder ich gebe ihn an euch? Beides stimmt nicht ganz.
Im Rahmen meiner derzeitigen Studie bastle ich ständig so kleine Python3-Scripte, die mir so kleine Aufgaben lösen.
Und immer denke ich: Ja mit der Bash geht das ja auch. Ich verstehe sed/tr, grep ausreichend gut, um einschätzen zu können, dass das sicher geht.
Und wie ihr selbst sagt, ist das eine mega banale Aufgabe. Ich dachte dafür gibt es eigentlich schon eine Lösung und ich erfinde das Rat nicht nochmal neu. Daher hatte ich hier eigentlich nicht auf Code, sondern auf ein "Das gibts doch schon!" gehofft.
Aber ich kenne meinen eigenen Bash-Kram. Hab hier selber Scripte am Laufen, die ich nach einer Woche schon selbst nicht mehr verstehe. Deswegen will ich nicht schon wieder die gleichen manpages und Handbücher lesen (die ich vorher auch schon gelesen, vergessen bzw. nie verinnerlicht habe) udn Code schreiben, den ich in einer Woche nicht mehr begreife - geschweige den, meine Kollegen.
IMO ist eine shell nicht für Menschen, sondern für Maschienen: Die Shell ist ein Raum, wo sich viele nette kleiner Prozesse (jeweils mit einerm Job) treffen, quatschen, Infos austauschen (über Pipes und Co) usw. Ab und zu kommt ein echter Mensch als Chef rein, "redet" ganz merkwürdig, gibt Anweisungen und verschwindet wieder. Lesbarkeit und all die Dinge, die ich da so vermisse, waren offensichtlich nie Teil des Entwurfskonzepts - das ist auch in Ordnung so. Es mag Leute geben, die das eingängig finden - ich nicht.
Bin auch kein WinDAU-Mäuseschuppser. Arbeite fast vollständig mit vim, XeTeX und so n Zeug, wo Effizienz halt einen anderen Stellenwert hat. Jedes use case hat eben andere Anforderungen.
Es ist so schon gerade schwierig, meinen Kollegen im Team zu erklären, was ich hier so eigentlich gerade anstelle mit den ganzen scripten und ihren Daten - da kann ich nicht noch mit Bash kommen.
Da fällt mir noch ein sehr wichtiger Grund ein: Fehleranfälligkeit ist deutlich niedriger wenn ich von Bash die Finger lasse. Wenn ich eine sed-tr-grep-dingsbums-Lösung nehmen würde, hätte ich nie das Gefühl, so wirklich sicher zu sein, dass die Dinger auch das machen was ich will. Nicht weil sie etwas falsches tun, sondern weil ich ihre Sprache nicht adäquat beherrsche.