Mailinglisten-Archive |
Hiho, > Von: Enrico Weigelt[SMTP:weigelt_(at)_metux.de] > > <snip> > > Eine HTML-Seite soll in ihre (Baum)-Struktur zerlegt werden. D.h. am > > Ende der Zerlegung soll ungefähr so irgend etwas herauskommen, > > mit dem ich schnell auf z.b. > > > > Body -> 5. Tabelle -> 4. Zeile -> 3. Zelle -> Inhalt > brauchst du da die vollstaendige struktur oder willst du einfach > nur content aus einer seite mit gleichbleibender struktur extrahieren ? > letzteres. Geschickt wäre halt, wenn man die Seite nur einmal parsen müsste, und den Inhalt dann in ein Mehrdimensionales Array ablegt, so daß man einfach auf die entsprechenden Elemente zugreifen kann. Allerdings war ich grad 2 h in einem Sinnlosmeeting und hab mir dadrin überlegt, daß man dafür eine kleine Klasse schreiben könnte, die dann bei jedem Zugriff a la $inhalt = GetContent(array( 'body' =>1, 'p' => 0, 'table' => 5, 'tr' => 4, 'td' => 3); die Seite parst und dann den gewünschten Inhalt ausgibt ... das sollte nicht allzuschwierig sein. Schwieriger würds sein, den Inhalt erstmal in ein Multidi- mensionales Array zu bringen und dann so abfragbar zu machen.... Grüße, Mathias
php::bar PHP Wiki - Listenarchive