Exkurs - Experimente mit einem Hexeditor
Aufgabe 1: Binärdarstellung von Zeichen
Wir benutzen im Folgenden den Hexeditor, den man in den Texteditor Notepad++ integrieren kann. Mit Hilfe dieses Hexeditors kann man sich die Binärdarstellung von Zeichen, die man zur Erstellung eines Textes benutzt, anschauen.
Die Screenshots zeigen, wie der abgebildete Text binär dargestellt wird:
Welches Bitmuster wird zur Darstellung des Buchstaben A
benutzt, welche Bitmuster werden wohl zur Darstellung
der Buchstaben B
, C
usw. benutzt?
Was hat es mit den beiden Bitmustern 00001101
und 00001010
auf sich? Führe gezielt Experimente durch,
um das herauszufinden.
In der gezeigten Binärdarstellung von Zeichen werden 8 Bits zur Kodierung benutzt. Wie viele verschiedene Zeichen können so dargestellt werden?
Untersuche, wie Umlaute und andere Sonderzeichen dargestellt werden. An welchem Bit kann man erkennen, dass es sich um ein Sonderzeichen handelt?
Aufgabe 2: Zeilenumbrüche
Geh noch einmal von der Binärdarstellung des gezeigten Textes aus:
Mit [Format][Convert to UNIX-Format] kann man auf die Darstellung in einem anderen Betriebssystem umschalten. Die Screenshots zeigen, was sich hierbei ändert.
Welche Unterschiede zeigen sich bei der Darstellung von Zeilenumbrüchen? Inwiefern kann das zu Problemen führen?
Aufgabe 3: Sonderzeichen
Der neue Text enthält Sonderzeichen. Schau dir erst einmal an, wie diese in der ANSI-Kodierung dargestellt werden. An welchem Bit kann man erkennen, dass es sich um ein Sonderzeichen handelt?
Mit [Format][Encode in UTF-8] kann man auf eine andere Kodierung umschalten. Gib den Text genau wie vorher ein und schau dir jetzt die Binärdarstellung an.
Wie viele Bytes werden hier zur Darstellung der Sonderzeichen benutzt?
Am Anfang der Datei sind drei zusätzliche Bytes eingefügt worden. Es handelt sich hierbei um ein sogenanntes
BOM (byte order mark
). Recherchiere, was es mit diesem BOM auf sich hat.