phpbar.de logo

Mailinglisten-Archive

[php] levenshtein

[php] levenshtein

Norbert Pfeiffer norbert at itbw.de
Fre Feb 3 16:33:56 CET 2006


Hallo Ringo,

> hat jemand einen vorschlag, ob man eine derartige funktion
> nach mysql verlagern kann oder wie man das performant mit
> php angeht?
Vorschlag,
- verwende mysqldump um eine Datei der zu pruefenden Tabelle
  anzulegen. Wenn man das geschickt macht, kann man die
  Insert-Statements easy in PHP-Arrays ueberfuehren.
- danach hast Du alle Zeit der Welt, um mit einem Shellscript
  dieses Array nach Duplikaten zu durchforsten, wobei alle
  mutmassliche Records in eine Logfile gepacktwerden.
- dieses Logfile liest Du mit einem Auswertescript ein,
  zeigst die vermeintlichen Duplikate mit einer Checkbox an,
  so dass der Pruefer bestimmen kann, was davon gheloescht
  wird.
Okay - rasend schnell ist das nicht, aber sehr praktikabel.
Notfalls baut man das so, dass man es einmal am WE laufen
lassen kann. Das sollte dann IMHO reichen ...


m. b. G. Norbert
_____________________
normal:  02682-966898
Notruf:  0163-3613642
---------------------
e.o.m.

php::bar PHP Wiki   -   Listenarchive