Mailinglisten-Archive |
Hallo, You wrote on 09/01/2009 12:21 PM: > $text = "Hier ein String der kurz ist und der nichts doppeltes enthält"; > > Würde man einfach den String splitten und schauen ob Wörter doppelt > sind, so würde der String durchfallen. Allerdings ist dieser in Ordnung! > Verständlicher? Es gibt in der Computerlinguistik bestimmt Verfahren, die so etwas ermöglichen, was Du Dir vorstellst. Ich bin allerdings schon eine Weile aus dem Thema raus. Das mit den Artikeln und ähnlichen Funktionswörtern löst man normalerweise mit Stop words: http://de.wikipedia.org/wiki/Stoppwort Vielleicht kannst Du Dir mit String-Vergleichsalgorithmen helfen. So was wie Levenshtein-Distanz z.B. http://de.wikipedia.org/wiki/Levenshtein-Distanz Ich bin mir aber nicht sicher, ob das für so lange Strings wie in Deinem Beispiel praktikabel ist. Vielleicht kennt ja jemand eine passende vorgefertigte extension. bye Alex
php::bar PHP Wiki - Listenarchive