Mailinglisten-Archive |
>> > habe ein Problem mit HTML-Dateien, wo ich gewisse MusternWoerte >> > erkennen und identifizieren moechte, wo sich diese Muster >> > befinden (so etwa wie innerHTML, outerHTML im IE), usw. >> [...] > so, jetzt moechte ich folgendes haben: > - Word1 liegt innerhalb vom <a> tag, und zwar richtig drin > - Word2 liegt ausserhalb von tags, der naechstrelevante relevante > tag ist <font> > - Word3 liegt ausserhalb von tags, der naechstrelevante relevante > tag ist <input type> > ..... mein Kollege sagt: Du brauchst einen kompletten HTML-Parser, weil das f=FCr = einfache Regex zu komplex sei ! Er meint, Du solltest lieber Perl und HTML::Parser nehmen: http://theoryx5.uwinnipeg.ca/CPAN/data/HTML-Parser/Parser.html http://theoryx5.uwinnipeg.ca/CPAN/data/ Gr=FC=DFe, Sabine --=20 AGI Magirusstrasse 21B, 70469 Stuttgart Fon +49 (0)711.228 74-50, Fax +49 (0)711.228 74-88 +++news+++news+++news+++ AGI baut eCampus fuer HypoVereinsbank http://www.agi.de/tagebuch/ http://www.agi.com/diary/ (english)
php::bar PHP Wiki - Listenarchive