phpbar.de logo

Mailinglisten-Archive

[php] UTF-8 wird nur teilweise dekodiert

[php] UTF-8 wird nur teilweise dekodiert

Thomas Langfeld opa.thomas at fhtw-berlin.de
Don Mar 4 14:23:13 CET 2004


Alexander Wagner wrote:
> On Thursday 04 March 2004 13:53, Thomas Langfeld wrote:
> 
>>Es handelt sich z.B. um die deutschen Anführungszeichen: „ und “
> 
> 
> Diese sind nicht in ISO-8859-1 (Latin-1) vorhanden. Wenn man UTF-8 in 
> ISO-8859-1 umwandelt, gehen sie nunmal verloren

Danke für die fixe Antwort, das ist natürlich einleuchtend.

Eine Idee, was man jetzt tun kann, um die Zeichen _irgendwie_ 
beizubehalten - bzw. wenigstens zu erkennen, ob es sich um 
Nicht-ISO-Zeichen handelt?

Es geht um folgendes:
Ein Text kommt UTF-8 kodiert an, wird von jemandem bearbeitet (der noch 
nie etwas von Unicode gehört hat, deswegen die UTF8-Dekodierung), danach 
soll der Text wieder UTF-8-kodiert zurückgeliefert werden.
Wäre natürlich irgendwie doof, wenn dabei eine Menge Zeichen komplett 
verloren gehen :-(


Gruß
Thomas

php::bar PHP Wiki   -   Listenarchive