phpbar.de logo

Mailinglisten-Archive

[php] Spidern von Links aus einer HTML - Seite

[php] Spidern von Links aus einer HTML - Seite

Frat | g. cheaters at gmx.de
Son Mar 14 00:58:50 CET 2004


Hallo,

nein auch so funktioniert das nicht.
Das ist auch bei dem jetzigen Spider nicht der Fall, da ich
nicht weiß, wie ich ausdrücken soll, dass es mehrere Links
gibt.

Habe im alten Spider folgendes:
$link_search =
preg_match_all("|.*<a.*href\=\"([^\"]*)\">+(.*?)<\/a>|iUs",$webseite,$link_s
earched);

Gruß, Frat | g.

----- Original Message ----- 
From: "Red Wingate" <redeye at erisx.de>
To: "deutschsprachige PHP-Mailingliste" <php at phpbar.de>
Sent: Sunday, March 14, 2004 12:39 AM
Subject: Re: [php] Spidern von Links aus einer HTML - Seite


> Hi,
>
> versuchs mal mit: preg_match_all :-)
>
> Frat | g. wrote:
>
> > Hallo !!
> >
> > Ich habe ein kleines Problem: undzwar habe ich einen Spider, der
> > Links von anderen HTML Seiten mit dem Link-Namen in eine
> > Datenbank speichert.
> >
> > Bis heute habe ich immer die Datei geöffnet und Zeile für Zeile
> > nach Links gesucht. Dies funktionierte aber nur wenn eine URL
> > in einer Zeile war.
> >
> > Jetzt habe ich ein Problem und muss den Spider anders gestalten.
> > Undzwar: Die Datei zuerst komplett einlesen und erst dann alle
> > Links mit dem Linknamen speichern.
> >
> > Wenn ich es mit preg_match() mache, findet er aber immer nur
> > einen Link von den vielen Links, die eigentlich in der HTML-
> > Seite sind.
> >
> > So ist der Inhalt z.B.:
> >
> > <a href="xx.php">XX</a></td><td>8/25/01</td><td>
> > <a href=XX>YY</a></td><td><a href=ZZ>ABC</a>
> > </td></tr><tr valign=top><td><a href=hallo.htm>Hallo</a></td>...
> >
> > Ich brauche unbedingt (eine Start-) Hilfe, da ich schon am
> > Verzweifeln bin.
> >
> > Danke :-)
> >
> > Frat | g.
> >
>
> -- 
> ** Allgemeine deutschsprachige PHP-Liste: php at phpbar.de **
> Informationen: http://www.phpbar.de
> http://lists.phpbar.de/mailman/listinfo/php
>


php::bar PHP Wiki   -   Listenarchive