phpbar.de logo

Mailinglisten-Archive

crawler/spider/robot mit phpmySQL - Erfahrungen

crawler/spider/robot mit phpmySQL - Erfahrungen

Ralf Geschke ralf at kuerbis.org
Fre Apr 11 21:21:15 CEST 2003


> ich habe gestern die phpdig in der "stabilen" 1.0er version installiert und
> das klappt eigentlich recht gut (da ich ja nur ausgewählte Seiten zu gerade
> aktuellen Themen durchforsten möchte).

Wenn's bei Dir klappt - umso besser. :-)

> Mit dem php-wrapper file für swish hat das leider nicht ganz so hingehauen,

Hmm, hier hast Du mich falsch verstanden - ich hatte erwaehnt,
dass ich mir eine Wrapper-Klasse geschrieben habe, die
ich momentan nur fuer meine eigenen Beduerfnisse einsetze,
etwa auf der genannten URL der Suche fuer diese Liste hier. 
Jene Klasse gibt's aber noch nirgendwo da draussen, d.h. 
letztlich weil ich immer ein wenig nachlaessig bei der Doku
bin, ansonsten wuerde sie unter der LGPL zur Verfuegung stehen. 

> da er auf file-pfade zugreifen möchte (und bereits vorher erstellte index
> *.idx dateien, dich ich nirgends entdecken und einbauen kann.

Naja, die Indizes muessen vorher erzeugt worden sein. 
Dies geschieht mittels eines einzigen Aufrufs des
swish-e-Binary, Beispiel aus dem realen Leben:
/opt/pdp/swish-e/bin/swish-e -e -c /opt/pdp/swish-e/var/mailarchive.config

> Mit htdig mngosearch glimpse usw. - ja das sind ja richtig professionelle
> Tools, wenn auch mir der Umfang

Mir gefaellt swish-e auf jeden Fall besser als jene. ;-)
Wobei ich gerne mnogosearch eingesetzt haette, aber
die Geschwindigkeit nicht ausreichte. 

> Cool auch der Tipp zu http://lists.mushaake.org/archive/swish.php - die
> suchergebnisse zu "crawler/robot/suchmaschine" sind ja Stoff für längere

Vielen Dank!

Beste Gruesse,
   Ralf

-- 
Infos zur Mailingliste, zur Teilnahme und zum An- und Abmelden unter
-->>  http://www.4t2.com/mysql 


php::bar PHP Wiki   -   Listenarchive