Supportnet Computer
Planet of Tech

Supportnet / Forum / Webseiten/HTML

was ist der Unterschied? ISO, Windows,UTF-8





Frage

Hallo, worin besteht der Unterschied zwischen, z.B.: charset=windows-1252 charset=UTF-8 charset=iso-8859-1 und was hat es für Auswirkungen, wenn man es nicht einschreibt. Danke

Antwort 1 von Friedel

Was passiert wenn man die Angabe nicht macht, kannst du dir unter http://www.friedels-home.com/Kurse/HTML/04sonderz.htmansehen.

charset=iso-8859-1 ist der Zeichsatz für mitteleuropäische Schriften. Er enthält alles, was man normalerweise braucht (also viel mehr, als auf dem Keyboard ist) außer den "Anführungszeichen unten". charset=iso-8859-1 ist laut W3C die korrekte Angabe.

charset=windows-1252 ist der der selbe Zeichensatz, enthält aber an den Stellen, wo im iso-8859-1 keine darstellbaren Zeichen sind, zusätzliche Zeichen. Diese Angabe entspricht nicht dem Standard und funktioniert nicht auf Nicht-Windows-Systemen. Da diese Systeme dann statt dessen meist automatisch iso-8859-1 verwenden ist es unwahrscheinlich, daß daraus jemals ein Fehler wird.
Zu UTF-8 kann ich nicht viel sagen, weil ich mich nicht genug auskenne:-)

Antwort 2 von Yoram

Danke Friedel! Übrigens verwendet z.B. Google dieses UTF-8 , also kann das ja nicht total verkehrt sein.

ciao

Antwort 3 von Yoram

Unicode:



Ein weltweit gültiger Zeichensatz (http://www.unicode.org). Unicode ist nahezu identisch mit ISO/IEC 10646 und beinhaltet etwa 40.000 verschiedene Zeichen. In Unicode hat jedes Zeichen einen 16-Bit-Code. Die ersten 256 Plätze entsprechen ISO Latin-1 (ISO 8859-1). Unicode wird in Java und XML verwendet. Unicode Version 3 enthält bereits die Zeichen für so alltägliche Bedürfnisse, wie das Schreiben mit altgermanischen Runen, oder das Kommunizieren mit den knapp 50.000 Cherokee-Indianer in Oklahoma. Der Rest ist in Reserve. Jedes Zeichen, welches neu aufgenommen werden soll muss beantragt und von der Organisation abgesegnet werden.

ISO 8859-1:


Die ISO-8859-Familie wurde vom European Computer Manufacturer's Association (ECMA) entwickelt. Es handelt sich um ein Set von standardisierten Zeichensätzen für alphabetische Schriften. Dazu gehören die lateinischen Schriften, auf denen die meisten Sprachen Westeuropas und Amerikas beruhen, oder etwa die kyrillischen Schriften.

Alle Zeichensätze dieser Familie basieren auf der 1-Byte-Abbildung eines Zeichens. Das heißt, alle Zeichensätze enthalten 256 mögliche Zeichen. Bei allen Zeichensätzen sind die ersten 128 Zeichen, also die Zeichen mit den Werten 0 bis 127, identisch mit dem ASCII-Zeichensatz. Das hat den Vorteil, dass die üblichen lateinischen Groß- und Kleinbuchstaben, die arabischen Ziffern und die üblichen Sonderzeichen wie Satzzeichen oder kaufmännische Zeichen in all diesen Zeichensätzen immer zur Verfügung stehen.


Quellen: http://selfhtml.teamone.de/inter/zeichensaetze.htm, http://selfhtml.teamone.de/inter/unicode.htm

Unter http://www.serbski-institut.de/utf-8_test.htm findest Du eine Testseite. Schalte in deinem Browser zwischen Westeuropäisch (ISO) und Unicode (UTF-8) hin und her und Du wirst die Unterschiede erkennen.

Hier findest Du die ISO 8859-1 Zeichensatztabelle

Ich möchte kostenlos eine Frage an die Mitglieder stellen:


Ähnliche Themen:


Suche in allen vorhandenen Beiträgen: