phpbar.de logo

Mailinglisten-Archive

[php] Doppelte ähnliche Texte abfangen?

[php] Doppelte ähnliche Texte abfangen?

Lutz Zetzsche Lutz.Zetzsche at sea-rescue.de
Don Nov 30 20:21:16 CET 2006


Hallo Andreas,

Am Donnerstag, 30. November 2006 15:56 schrieb Andreas Kempf:
> On Wed, 29 Nov 2006 15:35:22 +0100, Yannik Hampe wrote:
> >Du könntest auf die Textspalte erstmal einen Fulltext legen.
> >Dann kannst du mit
> >SELECT MATCH(spalte) AGAINST (text) AS relevanz FROM ...
> >Von MySQL einen Wert errechnen lassen, anhand dessen du einschätzen
> >kannst, ob es diese Nachricht schonmal gab.
> >Je höher der Wert in relevanz, je wahrscheinlicher ist es eine von
> >deinen Spams.
>
> Habe das jetzt mal getestet. Sieht sehr brauchbar aus. Laufzeit liegt
> bei rund 0.1 sekunden mit 160.000 Datensätzen.

geht es Dir eigentlich um das Auffinden ähnlicher oder gleicher PNs? Ich 
bin da gerade etwas unsicher geworden. :-)

Viele Grüße
Lutz

php::bar PHP Wiki   -   Listenarchive