Begriff gesucht

Smalltalk
Antworten
inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Begriff gesucht

Beitrag von inne » 13.02.2025 11:05:18

Hallo,

wie nennt man eine Folge von gleichen Zeichen in einer Zeichenkette bzw. eine Zeichenkette, die solche eine Folge enthält?
Also das ooo und aa in Fooobaar. Gibt es dafür einen Begriff?

LG,
inne

Benutzeravatar
GregorS
Beiträge: 3350
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Begriff gesucht

Beitrag von GregorS » 13.02.2025 11:12:15

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 11:05:18
wie nennt man eine Folge von gleichen Zeichen in einer Zeichenkette bzw. eine Zeichenkette, die solche eine Folge enthält?
Also das ooo und aa in Fooobaar. Gibt es dafür einen Begriff?
Ich kenne das als Doppel- oder Mehrfach-Vokal bzw. -Konsonant (wie in Schifffahrt).
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi und sog. Maker)

inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: Begriff gesucht

Beitrag von inne » 13.02.2025 11:36:18

Das nähert sich schonmal einer Lösung an!
Allgemeiner wäre schön, wenn es nun Zahlen oder Sonderzeichen sind...

Benutzeravatar
oln
Beiträge: 557
Registriert: 05.01.2021 09:41:24

Re: Begriff gesucht

Beitrag von oln » 13.02.2025 11:48:25

Ich kenne keinen Begriff für so ein Problem.
Nennen wir es doch einfach Zeichnfolge von gleichen Zeichen.
Wofür braucht man so etwas? Vielleicht erkärst du den Zusammenhang.
Gruß Ole
AbuseIPDB

Benutzeravatar
GregorS
Beiträge: 3350
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Begriff gesucht

Beitrag von GregorS » 13.02.2025 11:53:27

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 11:36:18
Allgemeiner wäre schön, wenn es nun Zahlen oder Sonderzeichen sind...
Wenn es nicht um Buchstaben geht, würde ich das schlicht als „Folge gleicher Zeichen“ bezeichnen. Einen einzelnen Begriff für so etwas kenne ich nicht.
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi und sog. Maker)

michaa7
Beiträge: 5120
Registriert: 12.12.2004 00:46:49
Lizenz eigener Beiträge: MIT Lizenz

Re: Begriff gesucht

Beitrag von michaa7 » 13.02.2025 11:54:18

Mehrfachzeichen? Mehrfachwiederholung (eines Zeichens)?
gruß

michaa7

-------------------------------
Menschen ändern gelegentlich ihre Ansichten, aber nur selten ihre Motive. (Oskar Negt)

inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: Begriff gesucht

Beitrag von inne » 13.02.2025 12:03:28

Daraus werde ich mir einen Namen überlegen.

Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.

Benutzeravatar
Meillo
Moderator
Beiträge: 9332
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Begriff gesucht

Beitrag von Meillo » 13.02.2025 12:15:26

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 12:03:28
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
charrepdetect :mrgreen:

(character repeat detector)
Use ed once in a while!

tobo
Beiträge: 2523
Registriert: 10.12.2008 10:51:41

Re: Begriff gesucht

Beitrag von tobo » 13.02.2025 12:28:44

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 12:03:28
Daraus werde ich mir einen Namen überlegen.

Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
In Linux würde man das vielleicht tr nennen (falls die Zeichen entfernt werden sollen):

Code: Alles auswählen

$ echo "444444222bcccc ddeefggggg" | tr -s [:alnum:]
42bc defg
$

inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: Begriff gesucht

Beitrag von inne » 13.02.2025 12:32:35

@tobo:

Nur erkennen, aber nicht verändern! Ginge das auch mit den Coreutils, mir fiel dazu gestern nichts ein?

tobo
Beiträge: 2523
Registriert: 10.12.2008 10:51:41

Re: Begriff gesucht

Beitrag von tobo » 13.02.2025 12:36:39

Coreutils, hmm? Also sowas könntest du zumindest direkt (true/false) auswerten:

Code: Alles auswählen

grep -q "\(.\)\1"
das fragt, ob es mindestens ein Zeichen gibt, das direkt danach nochmal vorkommt.

EDIT: Das Prinzip kann man natürlich auch nur auf bestimmte Zeichen anwenden.
Zuletzt geändert von tobo am 13.02.2025 12:48:25, insgesamt 2-mal geändert.

Benutzeravatar
GregorS
Beiträge: 3350
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Begriff gesucht

Beitrag von GregorS » 13.02.2025 12:37:53

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 12:03:28
Es geht um ein Script, das Worte mit solchen Folgen von Mehrfachwiederholungen eines Zeichens erkennt und das braucht noch einen sprechenden Namen.
Ich habe solche Folgen früher scherzhaft als „Klümpchen“ bezeichnet. Lt. ding lautet die englische Übersetzung für Klümpchen „nodule“. Ich würde so ein Script demnach wohl „charnodule-Detektor“ o.ä. nennen.
tr ist zwar ein gutes Beispiel für die Ersetzung solcher Zeichenfolgen, aber der Name leitet sich wohl von „translate“ ab und was Du suchst ist das, was vor der Ersetzung passiert . Etwas wie „pre-tr“ wäre wohl auch treffend, aber nicht so sprechend.
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi und sog. Maker)

Benutzeravatar
Meillo
Moderator
Beiträge: 9332
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Begriff gesucht

Beitrag von Meillo » 13.02.2025 12:39:10

Hier zwei Ansatzpunkte ... vielleicht geht davon etwas in die passende Richtung:

Code: Alles auswählen

sed 's/\(.\)\1\{1,\}/xxx/g'

Code: Alles auswählen

sed 's/\(\(.\)\2\{1,\}\)/<\1>/g'
Use ed once in a while!

inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: Begriff gesucht

Beitrag von inne » 13.02.2025 12:58:56

Meillo hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 12:15:26
charrepdetect :mrgreen:

(character repeat detector)
So habe es nun genannt. Das trifft es schon sehr gut.

Das sed/RE schaue ich mir nachher mal an... ich will dann mal sehen, ob hier Perl mit Stringfunktionen vielleicht schneller ist :wink:

Benutzeravatar
Meillo
Moderator
Beiträge: 9332
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Begriff gesucht

Beitrag von Meillo » 13.02.2025 14:00:35

inne hat geschrieben: ↑ zum Beitrag ↑
13.02.2025 12:58:56
ich will dann mal sehen, ob hier Perl mit Stringfunktionen vielleicht schneller ist :wink:
Kommt halt darauf an, was genau du machen willst. Vermutlich wird es einfacher sein und flexibler ist es sowieso, wenn du einfach den Input Zeichen fuer Zeichen liest und je nach Situation mit ein paar Fallunterscheidungen entsprechend reagierst, als irgendeine tolle Regexp zu bauen, die dann doch beschraenkt ist.
Use ed once in a while!

inne
Beiträge: 3304
Registriert: 29.06.2013 17:32:10
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Re: Begriff gesucht

Beitrag von inne » 13.02.2025 14:51:19

Ich habe diesen Code dafür genommen. Ich habe hier eine Liste von Worten und möchte die mit diesen Folgen weglassen:

Code: Alles auswählen

sub has_charrep {
	my ($word) = @_;
	for (my $i=1;$i<scalar(@{$word});$i++) {
		if ($word[$i-1] eq $word[$i]) {
			return 1;
		}
	}
	return 0;
}
[...]
	if ($no_charrep && has_charrep(\@word)) {
		next;
	}
[...]
PS: Hat nicht einmal Stringfunktionen.

Benutzeravatar
Meillo
Moderator
Beiträge: 9332
Registriert: 21.06.2005 14:55:06
Wohnort: Balmora
Kontaktdaten:

Re: Begriff gesucht

Beitrag von Meillo » 13.02.2025 15:55:59

Wenn du nur wissen willst, ob im Wort Doppelbuchstaben sind, dann kannst du die Worte einfach mit der Regexp von tobo filtern. Das ist dann ein Einzeiler.
Use ed once in a while!

reox
Beiträge: 2579
Registriert: 06.06.2006 22:09:47
Lizenz eigener Beiträge: MIT Lizenz

Re: Begriff gesucht

Beitrag von reox » 13.02.2025 21:41:20

Hab extra mal in meinem Theoretische Informatik und Logik Skriptum nachgeschlagen: in einer formalen Sprache wird die n-fache Konkatenation eines Wortes mit sich selbst auch als die Potenz bezeichnet, folgend aus der Mathematischen Definition (wieso gibt es eigentlich hier keinen TeX bbcode?): w^n = w . w^(n-1).
Ich hab dort zwar keine formale Definition von solchen Zeichenketten gefunden aber möglicherweise kann man sie Quadrat-, Kubik-, Quart-, ... Symbole nennen. Vorsicht ist nur geboten, da w^0 = epsilon (das neutrale Element). Also kann man höchstens sagen es sind Potenzwörter mit einem Grad >=2...

Antworten