phpbar.de logo

Mailinglisten-Archive

AW: [php] keywords extrahieren

AW: [php] keywords extrahieren

Wolfgang Hauck php_(at)_phpcenter.de
Mon, 1 Jul 2002 10:23:22 +0200


>ich möchte aus einer html-Seite Keywords extrahieren. Ich dachte mir
>dazu, das ich einfach die Seite einlese, alle Tags rausschmeiße,
>Wörter mit weniger als 4 Buchstaben und Kleingeschriebenes ebenfalls
>rausschmeiße und den Rest mit Kommata trenne und in die Keywords
>setze.

>Gibt es dafür evtl. eine Funktion, oder wie gehe ich das an?

>Bei meinen ersten Tests, werden zwar alle Tags entfernt, doch
>schreibt er den Inhalt von Nachbartags (ohne Zwischenraum) auch
>zusammen. So bekomme ich natürlich keine ordentlichen Keywords.

Hi Enno,

Da gibts ne Klasse names snoopy. Die zerfieselt eine html - Seite mit
verschiedenen Möglichkeiten (Links, Texte, Variablen usw.). Vielleicht
hilft dir das ein bischen weiter. Ist im übrigen simple zu handhaben.
Einfach includen ein new und los gehts (kein cofig notwendig). Zur Not
kannste ja das für deine Zwecke umschreiben.

The latest version of Snoopy can be obtained from:
http://snoopy.sourceforge.com

MFG Wolfgang


php::bar PHP Wiki   -   Listenarchive