Seite 1 von 1
Begriff gesucht
Verfasst: 13.02.2025 11:05:18
von inne
Hallo,
wie nennt man eine Folge von gleichen Zeichen in einer Zeichenkette bzw. eine Zeichenkette, die solche eine Folge enthält?
Also das ooo und aa in Fooobaar. Gibt es dafür einen Begriff?
LG,
inne
Re: Begriff gesucht
Verfasst: 13.02.2025 11:12:15
von GregorS
inne hat geschrieben: 
13.02.2025 11:05:18
wie nennt man eine Folge von gleichen Zeichen in einer Zeichenkette bzw. eine Zeichenkette, die solche eine Folge enthält?
Also das ooo und aa in Fooobaar. Gibt es dafür einen Begriff?
Ich kenne das als Doppel- oder Mehrfach-Vokal bzw. -Konsonant (wie in Schifffahrt).
Re: Begriff gesucht
Verfasst: 13.02.2025 11:36:18
von inne
Das nähert sich schonmal einer Lösung an!
Allgemeiner wäre schön, wenn es nun Zahlen oder Sonderzeichen sind...
Re: Begriff gesucht
Verfasst: 13.02.2025 11:48:25
von oln
Ich kenne keinen Begriff für so ein Problem.
Nennen wir es doch einfach Zeichnfolge von gleichen Zeichen.
Wofür braucht man so etwas? Vielleicht erkärst du den Zusammenhang.
Re: Begriff gesucht
Verfasst: 13.02.2025 11:53:27
von GregorS
inne hat geschrieben: 
13.02.2025 11:36:18
Allgemeiner wäre schön, wenn es nun Zahlen oder Sonderzeichen sind...
Wenn es nicht um Buchstaben geht, würde ich das schlicht als „Folge gleicher Zeichen“ bezeichnen. Einen einzelnen Begriff für so etwas kenne ich nicht.
Re: Begriff gesucht
Verfasst: 13.02.2025 11:54:18
von michaa7
Mehrfachzeichen? Mehrfachwiederholung (eines Zeichens)?
Re: Begriff gesucht
Verfasst: 13.02.2025 12:03:28
von inne
Daraus werde ich mir einen Namen überlegen.
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
Re: Begriff gesucht
Verfasst: 13.02.2025 12:15:26
von Meillo
inne hat geschrieben: 
13.02.2025 12:03:28
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
charrepdetect
(character repeat detector)
Re: Begriff gesucht
Verfasst: 13.02.2025 12:28:44
von tobo
inne hat geschrieben: 
13.02.2025 12:03:28
Daraus werde ich mir einen Namen überlegen.
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
In Linux würde man das vielleicht tr nennen (falls die Zeichen entfernt werden sollen):
Code: Alles auswählen
$ echo "444444222bcccc ddeefggggg" | tr -s [:alnum:]
42bc defg
$
Re: Begriff gesucht
Verfasst: 13.02.2025 12:32:35
von inne
@tobo:
Nur erkennen, aber nicht verändern! Ginge das auch mit den Coreutils, mir fiel dazu gestern nichts ein?
Re: Begriff gesucht
Verfasst: 13.02.2025 12:36:39
von tobo
Coreutils, hmm? Also sowas könntest du zumindest direkt (true/false) auswerten:
das fragt, ob es mindestens ein Zeichen gibt, das direkt danach nochmal vorkommt.
EDIT: Das Prinzip kann man natürlich auch nur auf bestimmte Zeichen anwenden.
Re: Begriff gesucht
Verfasst: 13.02.2025 12:37:53
von GregorS
inne hat geschrieben: 
13.02.2025 12:03:28
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
Ich habe solche Folgen früher scherzhaft als „Klümpchen“ bezeichnet. Lt. ding lautet die englische Übersetzung für Klümpchen „nodule“. Ich würde so ein Script demnach wohl „charnodule-Detektor“ o.ä. nennen.
tr ist zwar ein gutes Beispiel für die Ersetzung solcher Zeichenfolgen, aber der Name leitet sich wohl von „translate“ ab und was Du suchst ist das, was vor der Ersetzung passiert . Etwas wie „pre-tr“ wäre wohl auch treffend, aber nicht so sprechend.
Re: Begriff gesucht
Verfasst: 13.02.2025 12:39:10
von Meillo
Hier zwei Ansatzpunkte ... vielleicht geht davon etwas in die passende Richtung:
Re: Begriff gesucht
Verfasst: 13.02.2025 12:58:56
von inne
Meillo hat geschrieben: 
13.02.2025 12:15:26
charrepdetect
(character repeat detector)
So habe es nun genannt. Das trifft es schon sehr gut.
Das sed/RE schaue ich mir nachher mal an... ich will dann mal sehen, ob hier Perl mit Stringfunktionen vielleicht schneller ist

Re: Begriff gesucht
Verfasst: 13.02.2025 14:00:35
von Meillo
inne hat geschrieben: 
13.02.2025 12:58:56
ich will dann mal sehen, ob hier Perl mit Stringfunktionen vielleicht schneller ist
Kommt halt darauf an, was genau du machen willst. Vermutlich wird es einfacher sein und flexibler ist es sowieso, wenn du einfach den Input Zeichen fuer Zeichen liest und je nach Situation mit ein paar Fallunterscheidungen entsprechend reagierst, als irgendeine tolle Regexp zu bauen, die dann doch beschraenkt ist.
Re: Begriff gesucht
Verfasst: 13.02.2025 14:51:19
von inne
Ich habe diesen Code dafür genommen. Ich habe hier eine Liste von Worten und möchte die mit diesen Folgen weglassen:
Code: Alles auswählen
sub has_charrep {
my ($word) = @_;
for (my $i=1;$i<scalar(@{$word});$i++) {
if ($word[$i-1] eq $word[$i]) {
return 1;
}
}
return 0;
}
[...]
if ($no_charrep && has_charrep(\@word)) {
next;
}
[...]
PS: Hat nicht einmal Stringfunktionen.
Re: Begriff gesucht
Verfasst: 13.02.2025 15:55:59
von Meillo
Wenn du nur wissen willst, ob im Wort Doppelbuchstaben sind, dann kannst du die Worte einfach mit der Regexp von tobo filtern. Das ist dann ein Einzeiler.
Re: Begriff gesucht
Verfasst: 13.02.2025 21:41:20
von reox
Hab extra mal in meinem Theoretische Informatik und Logik Skriptum nachgeschlagen: in einer formalen Sprache wird die n-fache Konkatenation eines Wortes mit sich selbst auch als die Potenz bezeichnet, folgend aus der Mathematischen Definition (wieso gibt es eigentlich hier keinen TeX bbcode?): w^n = w . w^(n-1).
Ich hab dort zwar keine formale Definition von solchen Zeichenketten gefunden aber möglicherweise kann man sie Quadrat-, Kubik-, Quart-, ... Symbole nennen. Vorsicht ist nur geboten, da w^0 = epsilon (das neutrale Element). Also kann man höchstens sagen es sind Potenzwörter mit einem Grad >=2...