phpbar.de logo

Mailinglisten-Archive

Anti-Stopwords fuer Volltextindex

Anti-Stopwords fuer Volltextindex

Michael Donning donning at informenta.de
Fre Jan 31 15:19:02 CET 2003


Moin Norbert,

> -----Original Message-----
> From: Norbert Pfeiffer [mailto:norbert at itbw.de]
> normalerweise kommen alle dreibuchstabigen Woerter
> nicht in den Volltext-Index, soweit ist das klar.
>
> Gelegentlich waeren aber Ausnahmen durchaus sinnvoll.
> Z.B. BMW, NRW, GEZ oder aehnliches ...
>
> Hat dazu jemand eine Idee oder ist das in MySQL schon
> vorgesehen ...

Ab 4.0 gibts lt. Handbuch eine Variable ft_min_word_len, die die
mindestlänge regelt. Also man könnte das Limit generell auf z.B. 2 Zeichen
senken. In den Vorversionen müßte man wohl im Source "rumpfuschen" (altes
Thema).

Ansonsten stehts im Handbuch in der To-Do Liste (toll ne :) ) als 'Support
for "always-index words"'

6.8.3 Full-text Search TODO
- Make all operations with FULLTEXT index faster.
- Proximity operators
- Support for "always-index words". They could be any strings the user wants
to treat
as words, examples are "C++", "AS/400", "TCP/IP", etc.
- Support for full-text search in MERGE tables.
- Support for multi-byte charsets.
- Make stopword list to depend of the language of the data.
- Stemming (dependent of the language of the data, of course).
- Generic user-suppliable UDF preparser.
- Make the model more
exible (by adding some adjustable parameters to FULLTEXT in
CREATE/ALTER TABLE).

Gruss, Michael

-- 
Infos zur Mailingliste, zur Teilnahme und zum An- und Abmelden unter
-->>  http://www.4t2.com/mysql 


php::bar PHP Wiki   -   Listenarchive