Mailinglisten-Archive |
Heiko Schubert wrote: > > Die Suche dürfte dem Vektorretrieval entsprechen. > > ... was immer das sein mag ;-) > > Sorry, ich hatte vergessen zu erwähnen, daß ich kein Informatiker bin und > mir meine bisherigen Lösungen selber ausgedacht habe. Wenn Du Literatur zum Information-Retrieval liest, wirst Du dieses Verfahren vermutlich als eines der verbreiteten Verfahren finden. Wenn's Dich nicht weiter interessiert, sollten die recht vagen Ausführungen im Manual ausreichen. Hinter der etwas nebuläsen Ausführung "The function MATCH matches a natural language query AGAINST a text collection" dürfte sich halt das Vektorverfahren verbergen, wenn man sagt, daß da im Prinzip eine Skalarproduktberechnung zugrundeliegt, klingt das weniger geheimnisvoll. > Interessant, ich werde es auf jeden Fall mal testen. Meine bisherigen > Tests beinhalten 80.000 Artikel, von welchen fast jeder eine Beschreibung > von knapp 100 Wörtern hat. Die Suche nach einem Wort (auch und / oder) > ist eigentlich recht fix und problemlos in Webpräsentationen einsetzbar. > Nur ist die Datenpflege relativ komplex, da beim jedem INSERT, UPDATE und > DELETE eines solchen Textes eine Menge "Action" ;-) auf dem Rechner los > ist. Darum finde ich das Feature Volltextsuche sehr interessant. Auf ein explizites UND/ODER wirst Du verzichten müssen, der Volltextmechanismus von MySQL bietet dies nicht. Stattdessen gibt man einen "Mustertext" (bzw. eine Folge von Worten) an. Das Suchergebnis besteht aus Datensätzen, die möglichst viele dieser Worte enthalten. Im Prinzip ist das ähnlich wie bei AltaViste, wenn man kein "+" für das Zwangsweise UNT hinzufügt. Elmar --- *** Weitere Infos zur Mailingliste und MySQL unter http://www.4t2.com/mysql
php::bar PHP Wiki - Listenarchive