phpbar.de logo

Mailinglisten-Archive

[php] HTML-Seite parsen

[php] HTML-Seite parsen

Gloss Mathias php_(at)_phpcenter.de
Tue, 14 May 2002 15:49:32 +0200


Hiho,

> Von: 	Enrico Weigelt[SMTP:weigelt_(at)_metux.de]
>
> <snip>
> > Eine HTML-Seite soll in ihre (Baum)-Struktur zerlegt werden. D.h. am
> > Ende der Zerlegung soll ungefähr so irgend etwas herauskommen,
> > mit dem ich schnell auf z.b.
> >
> > Body -> 5. Tabelle -> 4. Zeile -> 3. Zelle -> Inhalt
> brauchst du da die vollstaendige struktur oder willst du einfach
> nur content aus einer seite mit gleichbleibender struktur extrahieren ?
>
letzteres. Geschickt wäre halt, wenn man die Seite nur einmal parsen
müsste, und den Inhalt dann in ein Mehrdimensionales Array ablegt,
so daß man einfach auf die entsprechenden Elemente zugreifen kann.

Allerdings war ich grad 2 h in einem Sinnlosmeeting und hab mir dadrin
überlegt, daß man dafür eine kleine Klasse schreiben könnte, die dann
bei jedem Zugriff a la

$inhalt = GetContent(array(
  'body' =>1,
  'p' => 0,
  'table' => 5,
  'tr' => 4,
  'td' => 3);

die Seite parst und dann den gewünschten Inhalt ausgibt ... das sollte nicht
allzuschwierig sein. Schwieriger würds sein, den Inhalt erstmal in ein
Multidi-
mensionales Array zu bringen und dann so abfragbar zu machen....


Grüße, Mathias


php::bar PHP Wiki   -   Listenarchive