phpbar.de logo

Mailinglisten-Archive

[php] Doppelte ähnliche Texte abfangen?

[php] Doppelte ähnliche Texte abfangen?

Andreas Kempf andreas.kempf at amalesh.de
Mit Nov 29 14:20:24 CET 2006


Hallo allerseits!

www.goatrance.de/goabase/ ist eine Community mit etwa 35.000 Usern. Es
gibt dort ein Nachrichten-System, mit dem sich User untereinander
schreiben können. Dabei kommt es ab & zu immer wieder vor, dass ein User
hunderten von anderen Usern die gleiche Message schickt (obwohl die
Nutzer-Regeln das verbieten - aber Troll ist halt Troll). U.a. wird das
jedoch auch von Membern aus Nigeria genutzt, die einen Vorschussbetrug
starten wollen (Nigeria-Connection/419). Und die sollen nun wirklich
nicht dort nerven.

Daher möchte ich es solchen Leuten gern so schwer wie möglich machen,
die gleiche Message mehrfach zu versenden. Ein einfacher Vergleich, ob
der Text bereits in der DB steckt, ist easy - aber durch den User auch
mit einer simplen Zeichenänderung zu umgehen. Daher vermute ich, dass
dieses Verfahren nicht wirklich hilft.

Hatte hier schon mal jemand ein ähnliches Problem und wenn ja, wie habt
ihr das gelöst?

Mein Ansatz dazu: Alle bisherigen Messages des Users holen, Wörter mit
weniger als 4 Buchstaben ignorieren, alle Zeichen ausser Buchstaben
eliminieren und den Rest durch count_chars schicken. Kommen die Top-10
mit gleicher Anzahl wieder vor, ist es wohl die gleiche Message... (?) 

TIA, Andreas

php::bar PHP Wiki   -   Listenarchive