phpbar.de logo

Mailinglisten-Archive

[php] Erkennen eines Character-Encodings

[php] Erkennen eines Character-Encodings

Lutz Zetzsche Lutz.Zetzsche at sea-rescue.de
Die Dez 14 14:24:16 CET 2004


Hi Andreas,

Andreas Lange schrieb:
> ich brauche für ein Script einen zuverlässigen Code, der das
> Character-Encoding einer Webseite erkennt.
>
> Folgenden Ansatz habe ich probiert:
>
> $html = file_get_contents('http://www.example.com/');
> mb_detect_encoding($html,"ASCII,JIS,UTF-8,EUC-JP,SJIS",true)
>
> Das funktioniert oft, aber eben nicht immer. Sehr oft erkennt er UTF-8
> Seiten nicht.

Hast Du mal geguckt, warum die UTF-8-Seiten nicht so gut erkannt werden?
Vielleicht liegt es ja daran, daß in diesen Seiten verschiedene
Zeichensätze vermischt sind. :-)


Viele Grüße

Lutz


php::bar PHP Wiki   -   Listenarchive