Mailinglisten-Archive |
>ich möchte aus einer html-Seite Keywords extrahieren. Ich dachte mir >dazu, das ich einfach die Seite einlese, alle Tags rausschmeiße, >Wörter mit weniger als 4 Buchstaben und Kleingeschriebenes ebenfalls >rausschmeiße und den Rest mit Kommata trenne und in die Keywords >setze. >Gibt es dafür evtl. eine Funktion, oder wie gehe ich das an? >Bei meinen ersten Tests, werden zwar alle Tags entfernt, doch >schreibt er den Inhalt von Nachbartags (ohne Zwischenraum) auch >zusammen. So bekomme ich natürlich keine ordentlichen Keywords. Hi Enno, Da gibts ne Klasse names snoopy. Die zerfieselt eine html - Seite mit verschiedenen Möglichkeiten (Links, Texte, Variablen usw.). Vielleicht hilft dir das ein bischen weiter. Ist im übrigen simple zu handhaben. Einfach includen ein new und los gehts (kein cofig notwendig). Zur Not kannste ja das für deine Zwecke umschreiben. The latest version of Snoopy can be obtained from: http://snoopy.sourceforge.com MFG Wolfgang
php::bar PHP Wiki - Listenarchive