Mailinglisten-Archive |
Joebi bei Strato wrote: > für eine Datenbank mit riesigen Textmengen (ca. 10.000 Texte a 700KByte > jährlich wachsend). mySQL kann zwar Folltextindexierungen, man muß aber das darunterliegende Vektorretrieval mögen, beispielsweise kann man da keine echte UND-Verknüpfung durchführen, wenn mehrere Suchworte angegeben werden, wird eine gewichtete ODER-Verknüpfung durchgeführt. Wenn man die UND-Verknüpfung per SQL realisiert "a MATCH b AND a MATCH d" dürfte die Performance signifikant einbrechen, hab ich aber noch nicht ausprobiert. Wenn die Texte nur einmal im Jahr ausgetauscht werden, empfiehlt es sich, eine Datenbank zu nehmen, bei der die Datenbank in einem Rutsch zusammengebaut wird. Retrievalmäßig sind die viel schneller, als Systeme, bei denen auf die Möglichkeit von Aktualisierungen Rücksicht genommen werden muß. Solche Systeme haben dann aber normalerweise keine SQL-Unterstützung. Programme ohne Index (Suche mit awk) haben bei der avisierten Textmenge keine Changse, die 10.000 Texte für jede Abfrage sequentiell zu scannen ist aussichtslos. Wenn die enge logische Anbindung an die relationalen Daten benötigt wird, solltest Du mit mySQL entsprechende Experimente machen, ob das System ausreicht. Elmar --- *** Weitere Infos zur Mailingliste und MySQL unter http://www.4t2.com/mysql
php::bar PHP Wiki - Listenarchive