phpbar.de logo

Mailinglisten-Archive

[php] Zeichensalat

[php] Zeichensalat

Peter Bieling network at media-palette.de
Die Mai 31 22:27:04 CEST 2005


Hallo Mario,

Mario Aeby wrote:

[unlesbare Zeichen]

> Als Beispiel sei folgende Seite
> 
> http://evub.unibe.ch/pievub/?page=lectures&id=188782
> 
> genannt. Die Veranstaltung S6435 enthält in ihrem Titel komische Zeichen 
> (man betrachte den Quellcode bspw. in vim).

habe ich gerade nicht zur Hand. Unter Windows-XP in Mozilla oder IE kann 
ich keine ungewöhnlichen Zeichen entdecken.
Hast Du die Datei mal direkt mit PHP eingelesen?

Eventuell könnte es sein, dass die Daten mit Excel erfasst wurden und 
mit einem anderen Programm nach XML exportiert wurden. Schuld können 
dann z.B. Zeichen sein, die in Latin 1 nicht vorkommen. (Gedankenstrich 
oder Anführungszeichen unten.)

> b) wie ich die Zeichen mit PHP wieder wegkriege

zB. so: $zeichenkette = str_replace(chr(160), '', $zeichenkette);
im Falle des Excel-Problems.

Noch ein Hinweis zum Parsen: Da es kein gültiges XHTML ist, würde ich 
einfach mit einem Regulären Ausdruck die Daten auslesen. Die Vorlesungen 
befinden sich ja alle in einer Zeile, was die Sache noch einfacher macht.

Viele Grüße und viel Erfolg

Peter
-- 
http://www.media-palette.de/tools/xml-line/

php::bar PHP Wiki   -   Listenarchive