Supportnet Computer
Planet of Tech

Supportnet / Forum / Webseiten/HTML

ISO-8859-1, UTF-8 .. was gibts da sonst noch?





Frage

Hi! Auf was für Content-types muss man gefasst sein, wenn man HTML-Dokumente (text/html) aus dem Web runterladen möchte? Bisher sind mir diese beiden ^^ untergekommen. Gibts da noch mehr? Danke! Mistral

Antwort 1 von rfb

Antwort 2 von Mistral2

Hallo rfb!

Ach Du Sch...ande! Das is aber ´n Haufen viel! Jetzt weiss ich gar nicht mehr was ich machen soll. Für die Konvertierung von UTF-8 nach Latin gibt es extra eine Funktion in PHP. Aber wie handle ich die Anderen alle?
Hilft es, wenn ich beim Request im Accept-Charset-Header nur die Beiden genannten angebe, oder wird das von vielen Servern ignoriert und die schicken mir dann einfach was SIE wollen? Mein Testserver (Jana2) unterstützt diesen Header z.B. gar nicht und auch der IE 5 verwendet ihn nicht.
Anscheinend ist Accept-Charset wohl nicht sehr gebräuchlich ..

Danke!
Mistral

Antwort 3 von rfb

lies dazu doch einfach dieses:
http://de.selfhtml.org/html/formulare/definieren.htm#zeichenkodierung
dort gibts auch den schlauen Rat: Um wirklich alle eingebbaren Zeichen der Benutzer erhalten zu können, benutzen Sie die Kodierung "UTF-8"

Antwort 4 von Mistral2

Ah, wieder was dazugelernt! Ich wusste nicht, dass es Accept-Charset bei Uploads auch von der Serverseite her gibt. Ich meinte mehr den Client-Request-Header beim Download.
Ich frag mich, wie ich exotisch codiert gelieferte Dokumente in lesbarer Form abspeichern kann.

Danke!
Mistral

Antwort 5 von Supermax

Sofern du dich auf den "westlichen" Kulturkreis beschränkst, solltest du mit UTF-8 und ISO-8859-X eigentlich auskommen.

Antwort 6 von Mistral2

Hallo Supermax!

OK, das beruhigt mich dann doch. :)

Danke Euch!
Mistral

Ich möchte kostenlos eine Frage an die Mitglieder stellen:


Ähnliche Themen:


Suche in allen vorhandenen Beiträgen: