Mailinglisten-Archive |
Hi Andreas, Andreas Lange schrieb: > ich brauche für ein Script einen zuverlässigen Code, der das > Character-Encoding einer Webseite erkennt. > > Folgenden Ansatz habe ich probiert: > > $html = file_get_contents('http://www.example.com/'); > mb_detect_encoding($html,"ASCII,JIS,UTF-8,EUC-JP,SJIS",true) > > Das funktioniert oft, aber eben nicht immer. Sehr oft erkennt er UTF-8 > Seiten nicht. Hast Du mal geguckt, warum die UTF-8-Seiten nicht so gut erkannt werden? Vielleicht liegt es ja daran, daß in diesen Seiten verschiedene Zeichensätze vermischt sind. :-) Viele Grüße Lutz
php::bar PHP Wiki - Listenarchive