phpbar.de logo

Mailinglisten-Archive

[php] AW: [php] =?iso-8859-1?Q?Suchmaschine_vor_Dummheit_der_ Benutzer_sch=FCtz? = en

[php] AW: [php] =?iso-8859-1?Q?Suchmaschine_vor_Dummheit_der_ Benutzer_sch=FCtz? = en

Beck, Mike php_(at)_phpcenter.de
Mon, 15 Apr 2002 11:43:10 +0200


> Es gibt mehrere Moeglichkeiten in php Pruefungen vorzunehmen:
>
> 1. int levenshtein (string str1, string str2)
> 2. string soundex (string str)
> 3. int similar_text (string first, string second [, double percent])
> 4. string metaphone (string str)
>

Das wären Möglichkeiten in PHP den Suchbegriff gegen eine stark begrenzte
Anzahl von Begriffen auf Ähnlichkeit zu überprüfen - ich habe aber eine
ständig wachsende Anzahl Seiten in meiner (MySQL) Datenbank für die ich in
der DB jeweils Titel, Keywords,Beschreibung und Pfad ablege (der eigentliche
Text liegt dann als Textfile vor, das wird mit phpCMS geparst).
Die Suchmaschine durchsucht also einmal begriff like titel,begriff=Keywords
und schliesslich begriff=Beschreibung (drei abfragen hintereinander weil die
gefundenen Ergebnisse jeweils anhand dessen wo sie gefunden wurden gewichtet
werden (treffer im titel=>wertung +=10, treffer in keywords =>wertung +=5
und so).

eine Seite hat also zum Beispiel den
Titel        = Schmutzfrachtberechnung
Keyword      = Schmutzfrachtberechnung, Mischwasserbehandlung,
Regenentlastungen, Nachweisverfahren
Beschreibung = Gegenüber dem herkömmlichen Bemessungsverfahren ist bei einem
Nachweisverfahren mittels Schmutzfrachtberechnung in der
Mischwasserbehandlung ein großes Einsparpotential gegeben

Nachdem das mal so ca. 100 Seiten werden sollen kann ich also unmöglich den
Suchbegriff auf Ähnlichkeit mit jedem einzelnem in titel, keyword oder
beschreibung der 100 seiten gefundenen Wörter vergleichen.

--
Gruß

Mike Beck
mike.beck_at_ibmiller.de
http://www.ibmiller.de


php::bar PHP Wiki   -   Listenarchive