phpbar.de logo

Mailinglisten-Archive

[php] Spidern von Links aus einer HTML - Seite

[php] Spidern von Links aus einer HTML - Seite

Red Wingate redeye at erisx.de
Son Mar 14 01:51:36 CET 2004


Das Ergebniss hat auch ein anderes Format als bei preg_match.

Match mit preg_match
   $result[0] - ganzer string
   $result[1] - erste klammerung
   ... etc ...

Match mit preg_match_all
   $result[0] - erster Match
   $result[0][0] - ganer string des ersten matches
   $result[0][1] - erste Klammerung des ersten matches
    ... etc ...

Frat | g. wrote:

> Hallo,
> 
> nein auch so funktioniert das nicht.
> Das ist auch bei dem jetzigen Spider nicht der Fall, da ich
> nicht weiß, wie ich ausdrücken soll, dass es mehrere Links
> gibt.
> 
> Habe im alten Spider folgendes:
> $link_search =
> preg_match_all("|.*<a.*href\=\"([^\"]*)\">+(.*?)<\/a>|iUs",$webseite,$link_s
> earched);
> 
> Gruß, Frat | g.
> 
> ----- Original Message ----- 
> From: "Red Wingate" <redeye at erisx.de>
> To: "deutschsprachige PHP-Mailingliste" <php at phpbar.de>
> Sent: Sunday, March 14, 2004 12:39 AM
> Subject: Re: [php] Spidern von Links aus einer HTML - Seite
> 
> 
> 
>>Hi,
>>
>>versuchs mal mit: preg_match_all :-)
>>
>>Frat | g. wrote:
>>
>>
>>>Hallo !!
>>>
>>>Ich habe ein kleines Problem: undzwar habe ich einen Spider, der
>>>Links von anderen HTML Seiten mit dem Link-Namen in eine
>>>Datenbank speichert.
>>>
>>>Bis heute habe ich immer die Datei geöffnet und Zeile für Zeile
>>>nach Links gesucht. Dies funktionierte aber nur wenn eine URL
>>>in einer Zeile war.
>>>
>>>Jetzt habe ich ein Problem und muss den Spider anders gestalten.
>>>Undzwar: Die Datei zuerst komplett einlesen und erst dann alle
>>>Links mit dem Linknamen speichern.
>>>
>>>Wenn ich es mit preg_match() mache, findet er aber immer nur
>>>einen Link von den vielen Links, die eigentlich in der HTML-
>>>Seite sind.
>>>
>>>So ist der Inhalt z.B.:
>>>
>>><a href="xx.php">XX</a></td><td>8/25/01</td><td>
>>><a href=XX>YY</a></td><td><a href=ZZ>ABC</a>
>>></td></tr><tr valign=top><td><a href=hallo.htm>Hallo</a></td>...
>>>
>>>Ich brauche unbedingt (eine Start-) Hilfe, da ich schon am
>>>Verzweifeln bin.
>>>
>>>Danke :-)
>>>
>>>Frat | g.
>>>
>>
>>-- 
>>** Allgemeine deutschsprachige PHP-Liste: php at phpbar.de **
>>Informationen: http://www.phpbar.de
>>http://lists.phpbar.de/mailman/listinfo/php
>>
> 
> 


php::bar PHP Wiki   -   Listenarchive