Mailinglisten-Archive | 
Hi Andreas,
Andreas Lange schrieb:
> ich brauche für ein Script einen zuverlässigen Code, der das
> Character-Encoding einer Webseite erkennt.
>
> Folgenden Ansatz habe ich probiert:
>
> $html = file_get_contents('http://www.example.com/');
> mb_detect_encoding($html,"ASCII,JIS,UTF-8,EUC-JP,SJIS",true)
>
> Das funktioniert oft, aber eben nicht immer. Sehr oft erkennt er UTF-8
> Seiten nicht.
Hast Du mal geguckt, warum die UTF-8-Seiten nicht so gut erkannt werden?
Vielleicht liegt es ja daran, daß in diesen Seiten verschiedene
Zeichensätze vermischt sind. :-)
Viele Grüße
Lutz
    php::bar PHP Wiki - Listenarchive