phpbar.de logo

Mailinglisten-Archive

[php] Volltextsuche ueber statische Seiten

[php] Volltextsuche ueber statische Seiten

Jens Kohl php_(at)_phpcenter.de
Wed, 24 Jul 2002 18:52:00 +0200


Hallo Thomas,

Mittwoch, 24. Juli 2002, 16:21:16, schriebst du:

TG> - es gibt Klassen die ich installiere und die alle Seiten durchsuchen
TG> - es gibt Scripts die einmal durch die Seite laufen, die Inhalte in eine
TG> DB portieren und ich dann mit der Suche die DB abfrage
TG> - es gibt Scripts die die Seiten nach meiner Suchanfrage über die Seiten
TG> laufen

Vergessen: benutzung von htdigist oder so ähnlich, kann auch htdig
heißen, ist jedenfalls das Standartprogram für solche Fälle.

TG> - bei den Klassen ist der Nachteil ich muss Server-Root-Zugriff haben
TG> (korrekt?)

Falsch wozu, es würd reichen wenn der User zugriff hat unter dem
PHP(respektive Apache) läuft.

TG> - bei den Scripts die es in eine DB portieren ist ich muss regelmässig
TG> updates machen, dafür ist die eigentliche Suche recht schnell

Deutsch? Wenn du jedesmal alle 60 Seiten durchscannen würdest, würde
eine (! - es soll ja server geben wo mehr als einer am tag zugreift)
viel zu lange dauern. Um nen vernünftigen Index kommst du nie herum.

Ausserdem 'portieren' die nichts.

TG> - bei den Scripts die erst über die statischen Seiten gehen wenn ich
TG> eine Suchanfrage gestartet hab kann es u.U. Ewigkeiten dauern und damit
TG> zu Scriptabbrüchen führen.

s.o. Scriptabbrüche (=Timeouts) kann man auch umgehen wenn man das
unbedingt will und die Rechte dazu hat.
http://de.php.net/set_time_limit

TG> Hat jemand Erfahrungen mit sowas? Welche Vor- und Nachteile gibt es noch
TG> und auf was muss ich evt. noch achten?!

FAZIT: Kein live-scannen, immer Indicies anlegen, wie ist egal. Wenn
dud as mit einer Datenbank wie MySQL 3.x probierst mußt du dich
zusätzlich um die Indexlogik kümmern. Ab MySQL 4.x entfällt das zum
Beispiel bei MySQL. Am Besten du guckst dich nach dem oben genannten
Program um.

Ausserdem gäbe es da noch mnogosearch, da gibt es auch eine PHP
Extension zu, fällt mir grad ein. Damit habe ich aber noch keine
Erfahrung, und ich würde auch behaupten das ist für deine Zwecke
Overkill.

-- 
 jens :: jens_(at)_php.net


php::bar PHP Wiki   -   Listenarchive