Mailinglisten-Archive |
Hallo Mario, Mario Aeby wrote: [unlesbare Zeichen] > Als Beispiel sei folgende Seite > > http://evub.unibe.ch/pievub/?page=lectures&id=188782 > > genannt. Die Veranstaltung S6435 enthält in ihrem Titel komische Zeichen > (man betrachte den Quellcode bspw. in vim). habe ich gerade nicht zur Hand. Unter Windows-XP in Mozilla oder IE kann ich keine ungewöhnlichen Zeichen entdecken. Hast Du die Datei mal direkt mit PHP eingelesen? Eventuell könnte es sein, dass die Daten mit Excel erfasst wurden und mit einem anderen Programm nach XML exportiert wurden. Schuld können dann z.B. Zeichen sein, die in Latin 1 nicht vorkommen. (Gedankenstrich oder Anführungszeichen unten.) > b) wie ich die Zeichen mit PHP wieder wegkriege zB. so: $zeichenkette = str_replace(chr(160), '', $zeichenkette); im Falle des Excel-Problems. Noch ein Hinweis zum Parsen: Da es kein gültiges XHTML ist, würde ich einfach mit einem Regulären Ausdruck die Daten auslesen. Die Vorlesungen befinden sich ja alle in einer Zeile, was die Sache noch einfacher macht. Viele Grüße und viel Erfolg Peter -- http://www.media-palette.de/tools/xml-line/
php::bar PHP Wiki - Listenarchive