Mailinglisten-Archive |
Hi, On Wed, Dec 08, 2004 at 06:55:51PM +0100, Peter Bieling wrote: > Zu Erklärung, die vielleicht jetzt langsam nötig wird: > Es handelt sich um ein Archiv mit Zeitungsartikeln, das online abrufbar > sein soll. Da auf mehrere Jahrgänge zugegriffen werden soll, sollte der > Index so klein aber effektiv wie möglich sein. Die Artikel werden in > einer XML-Struktur gespeichert und während dieser Aktion soll der Index > des Artikels erstellt werden. Dabei brauchen nur bestimmte "Felder" > berücksichtigt zu werden. Ich denke, dass ich noch die Möglichkeit > einbaue, besondere Keywords zu markieren, um noch eine > "Premiumsuchliste" generieren zu können. Eine herkömmliche > Online-Suchmaschine ist also nicht das, was ich haben will. Ich habe bei einem (wohl aehnlichen) Projekt, einem Presseclipping-Archiv mit vielen-1000 Artikeln, aus x-100 Medien, sortiert / ausgewertet nach Datum und allem was so ein Artikel sonst so her gibt sehr gute Erfahrungen mit einer Volltext-Suche ueber die MySQL gemacht. Fuer die 'Premiumsuche', statistische Auswertungen und allen moeglichen anderen Schnickschnack, habe ich bei diesem Projekt vor allem auf eine sinnvolle Daten/Tabellen-struktur (Medien, Rubriken, Themen, Artikel,....) die flexibel pro Kunde/Mandant erweiterbar ist wert gelegt, um damit gute Moeglichkeiten zur Indexierung in der DB zu bekommen. Auch die Sache mit der Suche "nur ueber bestimmte Felder" ist in einer DB halt sehr einfach und effizient zu loesen. Wenn ich dich richtig verstanden habe, willst du dir aus einem Datenbestand der auf Dateiebene in XML gespeichert ist selber einen Index fuer die Suche erstellen. Ich glaube ich wuerde da lieber die Arbeit/Zeit in ein gutes Datenmodell einer DB stecken und dann deren Moeglichkeiten der Indexierung nutzen. -- Gruss Jens
php::bar PHP Wiki - Listenarchive