Fachkonzept - ASCII-Code
ASCII-Code
Zeichen kann man recht einfach binär darstellen. Hierzu muss man nur jedem Zeichen ein bestimmtes Bitmuster zuordnen. Die Anzahl der dabei benutzten Bits hängt davon ab, wie viele Zeichen man binär kodieren möchte.
In einer Code-Tabelle wird jedem Zeichen (Ziffer, Buchstabe oder Sonderzeichen)
ein bestimmtes Bit-Muster zugeordnet. Beispielsweise wird in der (erweiterten) ASCII-Code-Tabelle
der Buchstabe A
durch das Bitmuster 01000001
und der
Buchstabe P
durch das Bitmuster 01010000
dargestellt.
Zeichenketten und ganze Texte lassen sich binär kodieren, indem man die Kodierungen der einzelnen Zeichen
aneinanderreiht. So wird beispielsweise die Zeichenkette PAUL
in (erweiterten) ASCII-Kodierungen
durch das Bitmuster 01010000 01000001 01010101 01001100
kodiert.
Es gibt internationale Standards, die die Binärkodierung von Zeichen genau festlegen. Der ASCII-Code (Abkürzung für American Standard Code for Information Interchange) wurde vom American National Standards Institute (ANSI) festgelegt. Er sieht (in der ursprünglichen Version) 7 Bits zur Kodierung vor - es lassen sich also 27 = 128 Zeichen darstellen.
Der reine ASCII-Code sieht keine Kodierung für sprachspezifischen Sonderzeichen (wie Umlaute in der Deutschen Sprache) vor und eignet sich daher nur bedingt für die Kodierung deutscher Texte. Um sprachspezifischen Besonderheiten gerecht zu werden, wurden eine Reihe von Erweiterungen des 7-Bit-ASCII-Codes zu einem 256 Zeichen umfassenden 8-Bit-Code vorgenommen. Alle diese Erweiterungen stimmen in den ersten 128 Zeichen mit dem ASCII-Code überein und legen die Kodierung der restlichen 128 Zeichen sprachspezifisch fest. Zu diesen Erweiterungen gehören die sogenannte ANSI-Kodierung und die Kodierungen der "ISO 8859"-Normenfamilie.
Eine vollständige Auflistung des (auf 8 Bit ergänzten) ASCII-Zeichensatzes findest du im Abschnitt Exkurs - ASCII-Code