Supportnet / Forum / Webseiten/HTML
ISO-8859-1, UTF-8 .. was gibts da sonst noch?
Frage
Hi!
Auf was für Content-types muss man gefasst sein, wenn man HTML-Dokumente (text/html) aus dem Web runterladen möchte? Bisher sind mir diese beiden ^^ untergekommen. Gibts da noch mehr?
Danke!
Mistral
Antwort 1 von rfb
Antwort 2 von Mistral2
Hallo rfb!
Ach Du Sch...ande! Das is aber ´n Haufen viel! Jetzt weiss ich gar nicht mehr was ich machen soll. Für die Konvertierung von UTF-8 nach Latin gibt es extra eine Funktion in PHP. Aber wie handle ich die Anderen alle?
Hilft es, wenn ich beim Request im Accept-Charset-Header nur die Beiden genannten angebe, oder wird das von vielen Servern ignoriert und die schicken mir dann einfach was SIE wollen? Mein Testserver (Jana2) unterstützt diesen Header z.B. gar nicht und auch der IE 5 verwendet ihn nicht.
Anscheinend ist Accept-Charset wohl nicht sehr gebräuchlich ..
Danke!
Mistral
Ach Du Sch...ande! Das is aber ´n Haufen viel! Jetzt weiss ich gar nicht mehr was ich machen soll. Für die Konvertierung von UTF-8 nach Latin gibt es extra eine Funktion in PHP. Aber wie handle ich die Anderen alle?
Hilft es, wenn ich beim Request im Accept-Charset-Header nur die Beiden genannten angebe, oder wird das von vielen Servern ignoriert und die schicken mir dann einfach was SIE wollen? Mein Testserver (Jana2) unterstützt diesen Header z.B. gar nicht und auch der IE 5 verwendet ihn nicht.
Anscheinend ist Accept-Charset wohl nicht sehr gebräuchlich ..
Danke!
Mistral
Antwort 3 von rfb
lies dazu doch einfach dieses:
http://de.selfhtml.org/html/formulare/definieren.htm#zeichenkodierung
dort gibts auch den schlauen Rat: Um wirklich alle eingebbaren Zeichen der Benutzer erhalten zu können, benutzen Sie die Kodierung "UTF-8"
http://de.selfhtml.org/html/formulare/definieren.htm#zeichenkodierung
dort gibts auch den schlauen Rat: Um wirklich alle eingebbaren Zeichen der Benutzer erhalten zu können, benutzen Sie die Kodierung "UTF-8"
Antwort 4 von Mistral2
Ah, wieder was dazugelernt! Ich wusste nicht, dass es Accept-Charset bei Uploads auch von der Serverseite her gibt. Ich meinte mehr den Client-Request-Header beim Download.
Ich frag mich, wie ich exotisch codiert gelieferte Dokumente in lesbarer Form abspeichern kann.
Danke!
Mistral
Ich frag mich, wie ich exotisch codiert gelieferte Dokumente in lesbarer Form abspeichern kann.
Danke!
Mistral
Antwort 5 von Supermax
Sofern du dich auf den "westlichen" Kulturkreis beschränkst, solltest du mit UTF-8 und ISO-8859-X eigentlich auskommen.
Antwort 6 von Mistral2
Hallo Supermax!
OK, das beruhigt mich dann doch. :)
Danke Euch!
Mistral
OK, das beruhigt mich dann doch. :)
Danke Euch!
Mistral

