phpbar.de logo

Mailinglisten-Archive

[php] DOM

[php] DOM

Sabine Kobold php_(at)_phpcenter.de
Fri, 31 Aug 2001 17:18:25 +0200


>> > habe ein Problem mit HTML-Dateien, wo ich gewisse MusternWoerte
>> > erkennen und identifizieren moechte, wo sich diese Muster
>> > befinden (so etwa wie innerHTML, outerHTML im IE), usw.
>>
[...]
> so, jetzt moechte ich folgendes haben:
> - Word1 liegt innerhalb vom <a> tag, und zwar richtig drin
> - Word2 liegt ausserhalb von tags, der naechstrelevante relevante
> tag ist <font>
> - Word3 liegt ausserhalb von tags, der naechstrelevante relevante
> tag ist <input type>
> .....

mein Kollege sagt: Du brauchst einen kompletten HTML-Parser, weil das f=FCr =

einfache Regex zu komplex sei !

Er meint, Du solltest lieber Perl und HTML::Parser nehmen:

http://theoryx5.uwinnipeg.ca/CPAN/data/HTML-Parser/Parser.html
http://theoryx5.uwinnipeg.ca/CPAN/data/


Gr=FC=DFe, Sabine

--=20
AGI
Magirusstrasse 21B, 70469 Stuttgart
Fon +49 (0)711.228 74-50, Fax +49 (0)711.228 74-88
+++news+++news+++news+++
AGI baut eCampus fuer HypoVereinsbank
http://www.agi.de/tagebuch/
http://www.agi.com/diary/ (english)


php::bar PHP Wiki   -   Listenarchive