Mailinglisten-Archive |
Hallo Jens, Jens Giessmann wrote: danke für die interessanten Anregungen! > Wenn ich dich richtig verstanden habe, willst du dir aus einem > Datenbestand der auf Dateiebene in XML gespeichert ist selber einen > Index fuer die Suche erstellen. Ich glaube ich wuerde da lieber die > Arbeit/Zeit in ein gutes Datenmodell einer DB stecken und dann deren > Moeglichkeiten der Indexierung nutzen. Ich werde wohl nicht drum herumkommen mal ein paar Tests zu machen. Vielleicht wäre es ein Weg, nicht für jedes Stichwort die Fundstellen zu speichern, sondern tatsächlich die Texte in die DB zu legen, eventuell aber indem man vorher die Stoppwörter und doppelte Vorkommen entfernt. (Möglichkeit: Hund Hund Herrchen Hund., daraus wird "Hund[3] Herrchen") Damit hätte man schon eine Menge ausgefiltert und den Datenbestand erheblich reduziert. Unterschiedliche Suchmöglichkeiten nach Datum, Autor, Überschriften, Kurztext, Langtext, eventuell noch Bildunterschriften und eigener Stichwortliste wären dann ebenfalls gegeben... Mal sehen. Viele Grüße Peter
php::bar PHP Wiki - Listenarchive