phpbar.de logo

Mailinglisten-Archive

[php] Erkennen von ähnlichen Texten

[php] Erkennen von ähnlichen Texten

Yannik Hampe yannik at cipher-code.de
Mit Jun 6 15:14:13 CEST 2007



Andre Wagner wrote:
> Hallo,
> 
> ich habe folgendes Problem:
> 
> Texte werden über ein Formular im Frontend in eine mySQL Datenbank gespeichert. Ein Administrator soll diese Texte vor Veröffentlichung freischalten. So weit, so gut. Nun sollen ähnliche Texte im Vorfeld gefiltert werden. Inhaltlich ist das logischerweise nicht möglich. Aber wenn beispielsweise ein Text mit dem Wortlaut 
> 
> "Lorem ipsum dolor sit amet, consectetuer adipiscing elit, bla bla bla..."
> 
> in der Datenbank vorhanden ist und jemand versucht diesen Text leicht abgewandelt ein zweites mal einzusenden, soll im Backend ein Warnhinweis erscheinen.
> 
> Als erstes fiel mir dazu metaphone und/oder similiar_text auf. Wobei similiar_text schon eine Möglichkeit bietet die Ähnlichkeit zweier Strings in Prozent zurückzugeben. Bei knapp 3000 gespeicherten Texten würde das bedeuteten, dass zu jeder Prüfung 3000 SQL-Abfragen nötig sind. Das wird mir die mySQL-Datenbank nicht danken. Oder gibt es da eine andere Möglichkeit?
> 
> Gruss,
> 
> Andre 
> 
> 

Das hatten wir schonmal lang und breit hier in der Mailingliste:

Betreff: [php] Doppelte ähnliche Texte abfangen?
Datum der ersten Mail in dem Thread: 29.11.2006 14:20

Ds sollte dir helfen diesen Umfangreichen Thread im Archiv zu finden :-).

Yannik

php::bar PHP Wiki   -   Listenarchive