Mailinglisten-Archive |
At 15:02 30.11.98 +0100, you wrote: >Hallo Leute, > >ich suche gerade eine Möglichkeit, aus einer HTML-Datei beliebige Tags und >deren Inhalt auszulesen (zum Beispiel <title>). Mit RegExps (z.B. eregi >("\<$tag([^>]*)$attrib([^>]*)>([^\<]*)\</$tag>", $document, $regs);) >funktioniert das zwar für das erste Tag, bei mehreren Vorkommnissen >(z.B.<b>) ist aber schon das Ende der Fahnenstange erreicht. > >Hat jemand von Euch eine Idee, wie ich das am besten realisieren könnte? > Ich hab das mal mit Perl realisiert. Dabei habe ich die HTML-Datei in einzelne Tokens umgebrochen (Trennzeichen "<") und habe dann eine Schleife über alle Tokens gemacht, in der ich untersuchen kann, inwiefern das Tag interessant für mich ist. Vielleicht ist sowas ja auch in PHP möglich, weiß ich aber leider nicht. Falls ja, gib doch mal eine Rückmeldung. Bye, Chris.
php::bar PHP Wiki - Listenarchive