phpbar.de logo

Mailinglisten-Archive

[php] Common Words

[php] Common Words

Kai Wenk kaishp at gmx.de
Fre Jul 23 10:18:06 CEST 2004


Hallo Sebastian,

Sebastian Mendel wrote:
> Robert Hennig schrieb:
> 
>>> gibt es irgendwo kostenlos eine Textdatei oder auch einen
>>> Datenbankdump oder ähnliches mit deutschen Common Words (also Wörter
>>> wie "und", "also", "mit", usw.)?

> z.b.: beim Indizieren von Texten sind es solche Worte die nicht mit 
> indiziert werden sollen, weil danach normalerweise eh keiner suchen will 
> ...
> 

Also, das phpBB2 indiziert beim Beitrag schreiben alle Wörter, und 
schließt "Common Words" aus. Diese sind hier im jeweiligen 
language-Ordner zu finden.

So z.B. /phpBB2/language/lang_german/search_stopwords.txt

In diesem Fall sind es immerhin 399 Wörter!

Wenn du aus verschiedenen Sprachen die Common Words benötigst, benötigst 
du nur die entsprechenden Language-Packs.

MfG, Kai Wenk

-- 
http://www.boozerchat.de

php::bar PHP Wiki   -   Listenarchive