![]() Mailinglisten-Archive |
>ich m�chte aus einer html-Seite Keywords extrahieren. Ich dachte mir >dazu, das ich einfach die Seite einlese, alle Tags rausschmei�e, >W�rter mit weniger als 4 Buchstaben und Kleingeschriebenes ebenfalls >rausschmei�e und den Rest mit Kommata trenne und in die Keywords >setze. >Gibt es daf�r evtl. eine Funktion, oder wie gehe ich das an? >Bei meinen ersten Tests, werden zwar alle Tags entfernt, doch >schreibt er den Inhalt von Nachbartags (ohne Zwischenraum) auch >zusammen. So bekomme ich nat�rlich keine ordentlichen Keywords. Hi Enno, Da gibts ne Klasse names snoopy. Die zerfieselt eine html - Seite mit verschiedenen M�glichkeiten (Links, Texte, Variablen usw.). Vielleicht hilft dir das ein bischen weiter. Ist im �brigen simple zu handhaben. Einfach includen ein new und los gehts (kein cofig notwendig). Zur Not kannste ja das f�r deine Zwecke umschreiben. The latest version of Snoopy can be obtained from: http://snoopy.sourceforge.com MFG Wolfgang
php::bar PHP Wiki - Listenarchive