Mailinglisten-Archive |
Peter wrote: > ich suche, bisher vergeblich eine Klasse, die einen deutschsprachingen > String einlesen kann und daraus eine alphabetische Wortliste erstellt, > aus der alle sogenannten Stoppwörter (und, oder, ein, der usw.) > entfernt wurden. (Gerade finde ich noch einen Hinweis, dass es sich > um etwas 200 Wörter handelt, die gefiltert werden müssen.) Eigentlich > müsste es so etwas doch fertig geben. Für diese schwierige Aufgabe habe ich eine hochkomplexe Klasse geschrieben: <?php $string = 'Das ist das Haus des Nikolaus und nebendran vom Weihnachtsmann.'; preg_match_all('|[a-zöäü]{4,}|i', $string, $words); sort($words); print_r($words); ?> Fragen zur Funktionsweise der einzelnen Methoden beantworte ich gerne! ;-) Gruss, Andreas -- http://www.andreas-demmer.de
php::bar PHP Wiki - Listenarchive