phpbar.de logo

Mailinglisten-Archive

[php] Character Entities

[php] Character Entities

Susanne Jäger susjaeger at sujag.de
Mon Okt 31 12:33:20 CET 2005


Ulrich Wiederhold wrote, On 30.10.2005 15:49:

> hat jemand ein Script, das mit automatisch in einem Text alle ä's, ü's
> etc. durch ä , uuml; etc. ersetzt?

um mich jetzt mal nicht in der Diskussion über die schon aufgezeigten
Lösungsmöglichkeiten zu verlieren. Warum will das überhaupt irgend jemand?

Mir fällt eigentlich kein Szenario ein, in dem eine solche Ersetzung
Sinn macht.

* du hast es ohnehin mit internationalen Texten zu tun: dann ist eine
UTF-8 taugliche Arbeits- und Entwicklungsumgebung unumgänglich in deren
Rahmen selbstverständlich auch deutsche Umlaute richtig behandelt werden.
* Texte entstammen dem westeuropäischen Sprachraum und die UTF-8
Unterstützung ist nicht auf allen Ebenen der Bearbeitung gesichert: dann
sollten die HTML/PHP Dateien als ISO-8859-1 (schlimmstenfalls Win-xxx)
ausgeliefert werden. Umlaute und westeuropäische Sonderzeichen dürften
von hier benutzten Betriebssystemen von fast allen Editoren per Default
entsprechend codiert sein, bei Formulareingaben kann das durch passende
Angabe der Seitencodierung in Kombination mit dem accept-charset
Attribut sichergestellt werden. Um Windows-eigene typographische
Sonderzeichen und das €-Zeichen sowie vereinzelt auftauchende
osteuropäische, kyrillische, japanische oder sonstwie Zeichen in
Eigennamen, musst du dich dann kümmern, die werden sinnvollerweise als
numerische Entities eingebaut.


Gruß
Susanne

---------------------------------------------
zum Nachlesen:
deutsch:
<http://www.dodabo.de/charset/index.html> Achtung. Original stammt von
2001, kleinere Aktualsierung 2003, da ist doch inzwischen viel passiert.

englisch:

"5.3 Character references
A given character encoding may not be able to express all characters of
the document character set. For such encodings, or when hardware or
software configurations do not allow users to input some document
characters directly, authors may use SGML character references."
<http://www.w3.org/TR/html401/charset.html#h-5.3>

Tutorial: Character sets & encodings in XHTML, HTML and CSS
http://www.w3.org/International/tutorials/tutorial-char-enc/Overview.en.html

Joel on Software - The Absolute Minimum Every Software Developer
Absolutely, Positively Must Know About Unicode and Character Sets (No
Excuses!)
<http://www.joelonsoftware.com/articles/Unicode.html>




-- 
http://sujag.de - Webentwicklung und -beratung
susjaeger at sujag.de
Lottumstr. 22, 10119 Berlin, Tel: 030 - 440 483 47

php::bar PHP Wiki   -   Listenarchive