Mailinglisten-Archive |
Hi almesh, amalesh kempf wrote: > > >> Es geht darum, ein forum durchsuchbar zu machen, und nicht eine ganze > >> website. > > > >Wo ist da der Unterschied? > > 1. Ein forum wird sinnvollerweise in einer SQL-tabelle vorgehalten. Eine > website wird nur sehr selten komplett in einer SQL-Tabelle vorgehalten, > sondern liegt als HTML etc. vor. Das will ich ja auch nicht bestreiten, meine Frage nach dem Unterschied bezog sich auch auf die Datenmengen. Dabei soll mir egal sein, ob die per Volltext zu durchsuchenden Daten aus einer Datenbank oder aus dem Filesystem kommen. > 2. Gäbe es keinen unterschied, wäre jede suche per SQL unsinnig. Darum geht es auch nicht. Natürlich braucht man SQL zur Verwaltung von Datenbeständen. Eine Volltextsuche kannst Du damit aber gerade bei großen Datenbeständen vergessen, es sei denn, Du akzeptierst die resultierenden Reaktionszeiten. > >Und das ist der Punkt: Eine Volltextsuche ist sehr viel schneller -- was > >man natürlich erst bei einer größeren Anzahl von Datensätzen merkt. > > Einen großer nachteil von htdig (als suchmaschine für inhalte aus > SQL-tabellen): Es ist nicht aktuell, sondern zeigt nur die ergebnisse des > letzten indexierungslaufes an. Also werden alle foren-beiträge, die nach dem > letzten index-lauf eingetragen wurden, nicht gefunden. Ich weiss zwar nicht, wie sich htDig bezüglich Aufnahme und Entfernen einzelner Dokumente aus dem Index verhält, aber ich behaupte mal, daß es nicht auf Minuten/Stunden ankommt. Letztlich muß man abwägen: Entweder schnelle+komfortable Suche, damit gute Benutzbarkeit bei wie auch immer verzögerter Aktualtität oder topaktuelle Suche mit schlechten Reaktionszeiten. Alles wie gesagt abhänig von der zu erschließenden Datenmenge und natürlich der Anzahl der Benutzer. Schönen Gruß, -- Thomas Schulz
php::bar PHP Wiki - Listenarchive