Mailinglisten-Archive |
Ulrich Wiederhold wrote, On 30.10.2005 15:49: > hat jemand ein Script, das mit automatisch in einem Text alle ä's, ü's > etc. durch ä , uuml; etc. ersetzt? um mich jetzt mal nicht in der Diskussion über die schon aufgezeigten Lösungsmöglichkeiten zu verlieren. Warum will das überhaupt irgend jemand? Mir fällt eigentlich kein Szenario ein, in dem eine solche Ersetzung Sinn macht. * du hast es ohnehin mit internationalen Texten zu tun: dann ist eine UTF-8 taugliche Arbeits- und Entwicklungsumgebung unumgänglich in deren Rahmen selbstverständlich auch deutsche Umlaute richtig behandelt werden. * Texte entstammen dem westeuropäischen Sprachraum und die UTF-8 Unterstützung ist nicht auf allen Ebenen der Bearbeitung gesichert: dann sollten die HTML/PHP Dateien als ISO-8859-1 (schlimmstenfalls Win-xxx) ausgeliefert werden. Umlaute und westeuropäische Sonderzeichen dürften von hier benutzten Betriebssystemen von fast allen Editoren per Default entsprechend codiert sein, bei Formulareingaben kann das durch passende Angabe der Seitencodierung in Kombination mit dem accept-charset Attribut sichergestellt werden. Um Windows-eigene typographische Sonderzeichen und das €-Zeichen sowie vereinzelt auftauchende osteuropäische, kyrillische, japanische oder sonstwie Zeichen in Eigennamen, musst du dich dann kümmern, die werden sinnvollerweise als numerische Entities eingebaut. Gruß Susanne --------------------------------------------- zum Nachlesen: deutsch: <http://www.dodabo.de/charset/index.html> Achtung. Original stammt von 2001, kleinere Aktualsierung 2003, da ist doch inzwischen viel passiert. englisch: "5.3 Character references A given character encoding may not be able to express all characters of the document character set. For such encodings, or when hardware or software configurations do not allow users to input some document characters directly, authors may use SGML character references." <http://www.w3.org/TR/html401/charset.html#h-5.3> Tutorial: Character sets & encodings in XHTML, HTML and CSS http://www.w3.org/International/tutorials/tutorial-char-enc/Overview.en.html Joel on Software - The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) <http://www.joelonsoftware.com/articles/Unicode.html> -- http://sujag.de - Webentwicklung und -beratung susjaeger at sujag.de Lottumstr. 22, 10119 Berlin, Tel: 030 - 440 483 47
php::bar PHP Wiki - Listenarchive