Mailinglisten-Archive |
Peter wrote:
> ich suche, bisher vergeblich eine Klasse, die einen deutschsprachingen
> String einlesen kann und daraus eine alphabetische Wortliste erstellt,
> aus der alle sogenannten Stoppwörter (und, oder, ein, der usw.)
> entfernt wurden. (Gerade finde ich noch einen Hinweis, dass es sich
> um etwas 200 Wörter handelt, die gefiltert werden müssen.) Eigentlich
> müsste es so etwas doch fertig geben.
Für diese schwierige Aufgabe habe ich eine hochkomplexe Klasse geschrieben:
<?php
$string = 'Das ist das Haus des Nikolaus und nebendran vom Weihnachtsmann.';
preg_match_all('|[a-zöäü]{4,}|i', $string, $words);
sort($words);
print_r($words);
?>
Fragen zur Funktionsweise der einzelnen Methoden beantworte ich gerne! ;-)
Gruss,
Andreas
--
http://www.andreas-demmer.de
php::bar PHP Wiki - Listenarchive