phpbar.de logo

Mailinglisten-Archive

[php] UTF8 Encoding funktioniert nur teilweise?

[php] UTF8 Encoding funktioniert nur teilweise?

Johannes Schlueter schlueter at phpbar.de
Mon Okt 31 15:05:21 CET 2005


Hallo,

Heiko Langenfeld - netz98 wrote:

>folgendes Problem ist beim encoding in utf8 in den Sprachen
>tschechisch, slowenisch und slowakisch aufgetreten.
>Das Zeichen ? wird beim abspeichern in die Datenbank und erneutem
>auslesen zu einem è .
>Alle anderen Zeichen funktionieren richtig. Auch das ? funktioniert,
>wenn man es als einzelnes Wort wegspeichert. Doch sobald man nur ein
>weiteres Wort hinzufügt verwandelt er es das Zeichen in obiges è.
>Beim einstellen in die Datenbank benutze ich utf8-encode,
>beim auslesen dann utf8-decode, die Kollation der Datenbanktabelle
>ist latin1_swedish_ci  und der Header beim auslesen ist
><meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
>
>  
>
Die genannten Sprachen nutzen Zeichen die nicht im iso-8859-1 
Zeichensatz vorhanden sind sondern aus iso-8859-2 stammen. Das Zeichen 
an Position E8 entspricht bei iso-8859-1 dem Zeichen è und unter 
iso-8859-2 dem Zeichen č. Also entweder komplett auf utf-8 umstellen 
oder zur Ausgabe (und beim utf8[en|de]code den richtigen Zeichensatz 
verwenden) den richtigen Zeichensatz angeben.

>Da die Spracherweiterung nachträglich eingebaut wurde ist eine Umstellung
>des Headers
>auf UTF8 nicht möglich - zudem funktionieren alle anderen Zeichen ohne
>Probleme.
>
>Wer kann mir helfen?
>
>Heiko Langenfeld
>  
>
johannes

>>dipl.-ing. <
>>unit new media engineering, web-development <
>>h.langenfeld at netz98.de <
>>    
>>
P.S. Bitte trenn die signatur mit "-- " 
(Strich-Strich-Leerzeichen-Zeilenumbruch) ab - dadurch trennt die mein 
Mailer automatisch beim antworten ab und es sorgt für eine Trennung 
zwischen inhalt und Text. Zudem wäre es schön wenn die Signatur aus 
keinem halben Roman bestünde.

php::bar PHP Wiki   -   Listenarchive