Logo des digitalen Schulbuchs inf-schule.de. Schriftzug in Zustandsübergangsdiagramm eines endlichen Automaten.

Fachkonzept - Formale Sprache

Das Alphabet einer Sprache

Sprachen nutzen ein System von Symbolen als Bausteine, um hieraus Spracheinheiten zu bilden. Ein solcher Symbolvorrat wird auch Alphabet genannt.

Ein Alphabet ist eine nicht-leere endliche geordnete Menge von Symbolen.

Beispiel: römische Zahldarstellung

Σröm = {I, V, X, L, C, D, M}

Beispiel: chemische Verbindungen

Σchem = {H, He, Li, Be, B, C, N, O, ..., 0, 1, ..., 9}

Beachte, dass der Begriff Alphabet hier eine allgemeinere Bedeutung hat als im Alltag. Die Symbole eines Alphabets sind frei wählbar und müssen dem jeweiligen Problemkontext entnommen werden. Sie müssen nicht dem Alltagsalphabet entstammen und können auch selbst aus mehreren Zeichen zusammengesetzte Einheiten sein (z.B. ist He ein Symbol des Alphabets Σchem).

Wörter über einem Alphabet

Der Begriff "Wort" wird hier ebenfalls in einer allgemeineren Weise benutzt.

Ein Wort über einem Alphabet ist eine Hintereinanderreihung endlich vieler Symbole aus einem vorgegebenen Alphabet.

Beispiel: Wörter über dem Alphabet Σröm = {I, V, X, L, C, D, M}:

LXX, XXL, MMCLII, LILI

Beispiel: Wörter über dem Alphabet Σchem = {H, He, Li, Be, B, C, N, O, ..., 0, 1, ..., 9}:

H2O, NaCl, 0BOCK

Menge aller Wörter über einem Alphabet

Beachte, dass man über einem gegebenen Alphabet unendlich viele Wörter bilden kann.

Bei der Bildung von Wörtern über einem Alphabet Σ lässt man auch zu, dass überhaupt keine Symbole hintereinandergereiht werden. Man nennt dieses besondere Wort leeres Wort und bezeichnet es üblicherweise mit ε oder λ.

Die Menge aller Wörter über einem Alphabet Σ wird mit Σ* bezeichnet. Mit Σ+ bezeichnet man die Menge aller Wörter über Σ ohne das leere Wort.

Beispiel: Menge aller Wörter über dem Alphabet Σröm = {I, V, X, L, C, D, M}:

Σröm* = {ε, I, V, X,..., M, II, IV, IX,..., IM, VI,..., VM,..., MM, III, IIV,...}

Sprache über einem Alphabet

Der Begriff "Sprache" wird jetzt ganz abstrakt präzisiert.

Eine (formale) Sprache über einem Alphabet Σ ist eine bestimmte Teilmenge der Menge Σ* aller möglichen Wörter über Σ.

Beispiel: Sprache der römischen Zahlen:

Lröm = {I, II, III, IV, V, VI, VII, VIII, IX, X, ...}

Diese Sprache ist einen Teilmenge von Σröm*, wobei Σröm = {I, V, X, L, C, D, M} als Alphabet benutzt wird.

Beachte, dass über dem Alphabet Σröm = {I, V, X, L, C, D, M} auch andere Sprachen gebildet werden können. Ein Beispiel hierfür wäre die Sprache der großen und übergroßen T-Shirt-Größen:

LT-shirt = {L, XL, XXL, XXXL, ...}

Für diese Sprache könnte man natürlich auch ein reduziertes Alphabet Σ = {L, X} benutzen.

Bemerkungen

Du hast sicher schon bemerkt, dass die Präzisierung der Begriffe hier mit den Mitteln der Mathematik erfolgt. Mit Hilfe des Mengen- und Folgenkonzepts aus der Mathematik werden die Begriffe "Alphabet", "Wort" und "Sprache" exakt definiert.

Die Begriffe "Alphabet", "Wort" und "Sprache" erhalten hierdurch eine spezielle Bedeutung, die sich durchaus an die Bedeutung der Begriffe im Alltag anlehnt, aber nicht genau mit der Bedeutung im Alltag übereinstimmt. So wird der Begriff "Alphabet" in einem allgemeineren Sinn verwendet.

Beachte auch, dass mit dem Begriff "(formale) Sprache" nur syntaktische Aspekte erfasst werden. Es kommt hier lediglich auf die Aneinanderreihung von Symbolen an, die Bedeutung von Symbolfolgen spielt dabei zunächst einmal keinerlei Rolle.

X

Fehler melden

X

Suche