phpbar.de logo

Mailinglisten-Archive

[php] Erkennen von ähnlichen Texten

[php] Erkennen von ähnlichen Texten

Andre Wagner andre.wagner at 8works.de
Mit Jun 6 14:09:37 CEST 2007


Hallo,

ich habe folgendes Problem:

Texte werden über ein Formular im Frontend in eine mySQL Datenbank gespeichert. Ein Administrator soll diese Texte vor Veröffentlichung freischalten. So weit, so gut. Nun sollen ähnliche Texte im Vorfeld gefiltert werden. Inhaltlich ist das logischerweise nicht möglich. Aber wenn beispielsweise ein Text mit dem Wortlaut 

"Lorem ipsum dolor sit amet, consectetuer adipiscing elit, bla bla bla..."

in der Datenbank vorhanden ist und jemand versucht diesen Text leicht abgewandelt ein zweites mal einzusenden, soll im Backend ein Warnhinweis erscheinen.

Als erstes fiel mir dazu metaphone und/oder similiar_text auf. Wobei similiar_text schon eine Möglichkeit bietet die Ähnlichkeit zweier Strings in Prozent zurückzugeben. Bei knapp 3000 gespeicherten Texten würde das bedeuteten, dass zu jeder Prüfung 3000 SQL-Abfragen nötig sind. Das wird mir die mySQL-Datenbank nicht danken. Oder gibt es da eine andere Möglichkeit?

Gruss,

Andre 



php::bar PHP Wiki   -   Listenarchive