phpbar.de logo

Mailinglisten-Archive

[php] HTML parsen

[php] HTML parsen

Jörg Krause php_(at)_phpcenter.de
Thu, 29 Nov 2001 13:34:39 +0100


Hallo,

> -----Ursprüngliche Nachricht-----
> Von: Ulrich Hacke
> Gesendet: Donnerstag, 29. November 2001 12:36
>
> Hallo,
> ich habe HTML-Quellcode mit mehreren Pseudotags (<tag...>), den ich in PHP
> einlese und parse. Beispiel:
> <tag parameter1="bla" parameter2="fasel" parameter3="test test test">
>
> Nach dem Parsen habe ich ein Array $content[$i]["name"], wobei "name" der
> Name der einzelnen Parameter ist und $i die vorgekommenen Tags indiziert.
> Ich arbeite mit einen regulären Ausdruck, um die Zeichenkette <tag...>
> herauszubekommen und nehme dann ein explode(" ", $zeile) für die einzelnen
> Teile. Wie bekomme ich es hin, dass ein Parameterwert auch Leerzeichen
> enthalten darf? Bin für jede Hilfe dankbar.
>

nimm preg_split(), das ist wie explode() aber mit einem regulären Ausdruck
zur Berechnung der Trennfelder. Denn es ist auch möglich, dass mehrere
Leerzeichen
zwischen den Parametern stehen:

<xml     par="cc"
         val="kkd"
         xxx="kkdj" />

Dies sollte ein solcher Parser eben auch erkennen, sonst macht man sich das
Leben unnütz schwer. Ansonsten ist dirngend zu empfehlen, die eigenen Tags
nach XML-Standard wohlgeformt zu halten, um später, wenn HTML zu XHTML
mutiert
ist, einen professionellen Parser verwenden zu können.

Jörg
******************
www.php.comzept.de


php::bar PHP Wiki   -   Listenarchive