Exkurs - Zeichencodierung bei Webseiten
Angaben zur Zeichencodierung
Im folgenden - sehr einfachen - HTML-Quelltext wird mit charset="iso-8859-1"
die gewünschte Zeichencodierung festgelegt.
<!DOCTYPE doctype html>
<html lang="de">
<head>
<meta charset="iso-8859-1"/>
<title>Text</title>
</head>
<body>
<h1>Viele Grüße!</h1>
</body>
</html>
Wir ändern sie in charset="iso-8859-5"
ab.
<!DOCTYPE doctype html>
<html lang="de">
<head>
<meta charset="iso-8859-5"/>
<title>Text</title>
</head>
<body>
<h1>Viele Grüße!</h1>
</body>
</html>
Wie wirkt sich diese Veränderung auf die Anzeige im Browser aus?
Für die folgenden Experimente kannst du dir die zugehörigen Dateien herunterladen (rechter Klick auf den Link, dann Ziel speichern): _quelltext1.html, _quelltext2.html.
Aufgabe 1: Darstellung im Browser
Wenn man die Quelltexte von einem Browser anzeigen lässt, dann sieht man sofort einen Unterschied. Hast du eine Erklärung hierfür?
Hinweis: Bei manchen Browsern muss man zunächst einstellen, dass die Zeichencodierung automatisch erkannt werden soll.
Aufgabe 2: Analyse mit einen Hex-Editor
Zur Kontrolle schauen wir uns den Inhalt der Dateien mit einem Hex-Editor an. Vergleiche die Stellen, die hier von besonderem Interesse sind.
Quelltext 1:
Quelltext 2:
Aufgabe 3: Codierungen
(a) Recherchiere zunächst die Zeichensätze ISO-8859-1 und ISO-88-59-5. Welche Gemeinsamkeiten haben sie? Worin unterscheiden sie sich?
(b) Erkläre das oben gezeigte Verhalten der Browser mit Hilfe der folgenden Abbildung.