phpbar.de logo

Mailinglisten-Archive

[php] noch mal Unicode

[php] noch mal Unicode

Thomas Richter php at wwedit.org
Mon Mar 29 18:44:49 CEST 2004


> danke - Du warst auf der richtigen Faehrte ...

kein problem.

achso... was uebrings auch noch recht wichtig waere... zu checken,
ob es sich wirklich um eine utf-8 codierte (NICHT UNICODE) datei
handelt.

einfach ausser beim ersten byte 128 abzuziehen ist zwar einfach
und schnell geloest..., aber du solltest auch schauen, ob die
obersten bits wirklich immer 10xx xxxx betragen.

desweitern solltest du darauf achten, dass man ein zeichen, welches
mit einem byte darstellbar ist, auch mit 2,3,4,5 oder 6 bytes
darstellen kann. dies sollte aber ausgeschlossen werden (soweit
ich noch weiss...)

gruss

thomas




php::bar PHP Wiki   -   Listenarchive