phpbar.de logo

Mailinglisten-Archive

[php] Indexer - Klasse oder Funktion gesucht

[php] Indexer - Klasse oder Funktion gesucht

Sebastian Mendel lists at sebastianmendel.de
Don Dez 9 08:23:45 CET 2004


Peter Bieling wrote:

> Zu Erklärung, die vielleicht jetzt langsam nötig wird:
> Es handelt sich um ein Archiv mit Zeitungsartikeln, das online abrufbar 
> sein soll. Da auf mehrere Jahrgänge zugegriffen werden soll, sollte der 
> Index so klein aber effektiv wie möglich sein. Die Artikel werden in 
> einer XML-Struktur gespeichert und während dieser Aktion soll der Index 
> des Artikels erstellt werden. Dabei brauchen nur bestimmte "Felder" 
> berücksichtigt zu werden. Ich denke, dass ich noch die Möglichkeit 
> einbaue, besondere Keywords zu markieren, um noch eine 
> "Premiumsuchliste" generieren zu können. Eine herkömmliche 
> Online-Suchmaschine ist also nicht das, was ich haben will.

Erst mal Entschuldigung das ich mich trotzdem nochmal außere trotz 
deiner abgelehnten Hilfe, da diese Mailingliste aber öffentlich ist und 
auch archiviert wird ist es mir eigentlich vollkomen egal ob der 
ursprüngliche Fragesteller meine Hilfe will oder nicht.

Mal ganz ehrlich versteh ich nicht wieso du erst jetzt sagst was du 
eigentlich willst, es gab vor kurzem schon Diskussionen wo es auch im 
weitesten Sinne um Presse-Texte ging, vielleicht hätten diese Leute ja 
auch eine Lösung wie sie ihre Texte durchsuchen.

Auf jeden Fall scheint mir die MySQL-Volltextsuche das beste zu sein was 
du momentan nehmen könntest zur indizierung, eventuell noch mnogosearch 
(osä.) zur Volltextsuche in Dokumenten, mit MySQL findest du dann auch 
sowas wie

"Black&Decker" oder "Dr. Helmut Kohl"

dafür würde ich eine aktuelle MySQL-Version verwenden (4.1?), da du dort 
eine eigene Stoppwort-Liste definieren kannst bei bedarf.

-- 
Sebastian Mendel

www.sebastianmendel.de www.warzonez.de www.tekkno4u.de www.nofetish.com
www.sf.net/projects/phpdatetime        www.sf.net/projects/phptimesheet


php::bar PHP Wiki   -   Listenarchive