phpbar.de logo

Mailinglisten-Archive

Re: [php] ht/dig (was: [php] Newsgruppe)
Archiv Mailingliste php_(at)_infosoc.uni-koeln.de

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [php] ht/dig (was: [php] Newsgruppe)



Hi almesh,

amalesh kempf wrote:
> 
> >> Es geht darum, ein forum durchsuchbar zu machen, und nicht eine ganze
> >> website.
> >
> >Wo ist da der Unterschied?
> 
> 1. Ein forum wird sinnvollerweise in einer SQL-tabelle vorgehalten. Eine
>    website wird nur sehr selten komplett in einer SQL-Tabelle vorgehalten,
>    sondern liegt als HTML etc. vor.

Das will ich ja auch nicht bestreiten, meine Frage nach dem Unterschied
bezog sich auch auf die Datenmengen. Dabei soll mir egal sein, ob die
per Volltext zu durchsuchenden Daten aus einer Datenbank oder aus dem
Filesystem kommen.

> 2. Gäbe es keinen unterschied, wäre jede suche per SQL unsinnig.

Darum geht es auch nicht. Natürlich braucht man SQL zur Verwaltung von
Datenbeständen. Eine Volltextsuche kannst Du damit aber gerade bei
großen Datenbeständen vergessen, es sei denn, Du akzeptierst die
resultierenden Reaktionszeiten. 

> >Und das ist der Punkt: Eine Volltextsuche ist sehr viel schneller -- was
> >man natürlich erst bei einer größeren Anzahl von Datensätzen merkt.
> 
> Einen großer nachteil von htdig (als suchmaschine für inhalte aus
> SQL-tabellen): Es ist nicht aktuell, sondern zeigt nur die ergebnisse des
> letzten indexierungslaufes an. Also werden alle foren-beiträge, die nach dem
> letzten index-lauf eingetragen wurden, nicht gefunden.

Ich weiss zwar nicht, wie sich htDig bezüglich Aufnahme und Entfernen
einzelner Dokumente aus dem Index verhält, aber ich behaupte mal, daß es
nicht auf Minuten/Stunden ankommt.
Letztlich muß man abwägen: Entweder schnelle+komfortable Suche, damit
gute Benutzbarkeit bei wie auch immer verzögerter Aktualtität oder
topaktuelle Suche mit schlechten Reaktionszeiten. Alles wie gesagt
abhänig von der zu erschließenden Datenmenge und natürlich der Anzahl
der Benutzer.


Schönen Gruß,
-- 
Thomas Schulz

Home | Main Index | Thread Index

php::bar PHP Wiki   -   Listenarchive