Mailinglisten-Archive |
Hallo Sebastian, Sebastian Mendel wrote: > Robert Hennig schrieb: > >>> gibt es irgendwo kostenlos eine Textdatei oder auch einen >>> Datenbankdump oder ähnliches mit deutschen Common Words (also Wörter >>> wie "und", "also", "mit", usw.)? > z.b.: beim Indizieren von Texten sind es solche Worte die nicht mit > indiziert werden sollen, weil danach normalerweise eh keiner suchen will > ... > Also, das phpBB2 indiziert beim Beitrag schreiben alle Wörter, und schließt "Common Words" aus. Diese sind hier im jeweiligen language-Ordner zu finden. So z.B. /phpBB2/language/lang_german/search_stopwords.txt In diesem Fall sind es immerhin 399 Wörter! Wenn du aus verschiedenen Sprachen die Common Words benötigst, benötigst du nur die entsprechenden Language-Packs. MfG, Kai Wenk -- http://www.boozerchat.de
php::bar PHP Wiki - Listenarchive