phpbar.de logo

Mailinglisten-Archive

Maximale Last

Maximale Last

Elmar Haneke mysql_(at)_lists.phpcenter.de
Wed, 11 Apr 2001 14:41:57 +0200


Joebi bei Strato wrote:

> für eine Datenbank mit riesigen Textmengen (ca. 10.000 Texte a 700KByte
> jährlich wachsend).

mySQL kann zwar Folltextindexierungen, man muß aber das
darunterliegende Vektorretrieval mögen, beispielsweise kann man da
keine echte UND-Verknüpfung durchführen, wenn mehrere Suchworte
angegeben werden, wird eine gewichtete ODER-Verknüpfung durchgeführt.
Wenn man die UND-Verknüpfung per SQL realisiert  "a MATCH b AND a
MATCH d" dürfte die Performance signifikant einbrechen, hab ich aber
noch nicht ausprobiert.

Wenn die Texte nur einmal im Jahr ausgetauscht werden, empfiehlt es
sich, eine Datenbank zu nehmen, bei der die Datenbank in einem Rutsch
zusammengebaut wird. Retrievalmäßig sind die viel schneller, als
Systeme, bei denen auf die Möglichkeit von Aktualisierungen Rücksicht
genommen werden muß. Solche Systeme haben dann aber normalerweise
keine SQL-Unterstützung.

Programme ohne Index (Suche mit awk) haben bei der avisierten
Textmenge keine Changse, die 10.000 Texte für jede Abfrage sequentiell
zu scannen ist aussichtslos.

Wenn die enge logische Anbindung an die relationalen Daten benötigt
wird, solltest Du mit mySQL entsprechende Experimente machen, ob das
System ausreicht.

Elmar

---
*** Weitere Infos zur Mailingliste und MySQL unter http://www.4t2.com/mysql 



php::bar PHP Wiki   -   Listenarchive