Mailinglisten-Archive |
Hallo Johannes, Johannes Schlueter wrote: > Abgesehen von 1&1 sehe ich da kein Problem wenn die selben Regeln für Die > Suchanfragen und die eigentlichen Daten gelten, dann wird aus Black&Decker > halt BlackDecker, gefunden wird es trotzdem. Nehmen wir mal dies hier, da wir ja schon in so vorweihnachtlicher Stimmung sind: <?php $string = 'Das ist das "Haus des Nikolaus" und Black&Decker und nebendran vom Weihnachtsmann.'; preg_match_all('|(\w+)+|', $string, $matches); $words=$matches[1]; sort($words); print_r($words); ?> Da hätte ich vorher & entfernen müssen, um das von Dir beschriebene Ergebnis zu bekommen. > Wenn die Daten in einer MySQL-Datenbank liegen lohnt evtl. auch der Blick auf > den Fulltext Index - der wurde für solche Dinge entwickelt. > http://dev.mysql.com/doc/mysql/en/Fulltext_Search.html Danke, ich werde noch mal sehen, ob sich das nutzen lässt, obwohl nicht alle Texte in die Datenbank sollen. Zu Erklärung, die vielleicht jetzt langsam nötig wird: Es handelt sich um ein Archiv mit Zeitungsartikeln, das online abrufbar sein soll. Da auf mehrere Jahrgänge zugegriffen werden soll, sollte der Index so klein aber effektiv wie möglich sein. Die Artikel werden in einer XML-Struktur gespeichert und während dieser Aktion soll der Index des Artikels erstellt werden. Dabei brauchen nur bestimmte "Felder" berücksichtigt zu werden. Ich denke, dass ich noch die Möglichkeit einbaue, besondere Keywords zu markieren, um noch eine "Premiumsuchliste" generieren zu können. Eine herkömmliche Online-Suchmaschine ist also nicht das, was ich haben will. Viele Grüße Peter
php::bar PHP Wiki - Listenarchive