Mailinglisten-Archive |
Hi Andre, Am Freitag, 13. Oktober 2006 11:40 schrieb Andre Wagner: > Hallo, > > kennt jemand ein Tool, mit dem ich ein Webseite durchsuchen kann? In > einer Webseite die (leider) aus statischem HTML besteht soll eine > Volltextsuche integriert werden. Hierzu habe schon etwas gefunden: > > http://www.planetc.de/download/planetsearch/planetsearch.html > > Zusätzlich sollen aber auch PDF Dokumente durchsucht werden. Kennt > jemand eine Anwendung die das schon erfüllt, oder ist wieder > "irgendwie selbermachen" angesagt? im Prinzip können das alle die namhaften Suchen, die mir gerade einfallen: ht://Dig: http://www.htdig.org/FAQ.html#q4.9 mnoGoSearch: http://www.mnogosearch.org/winhelp/ch16s03.html Lucene: http://www.jguru.com/faq/view.jsp?EID=862443 Wenn Du Dir aber die drei Seiten anguckst, wirst Du feststellen, daß alle drei Suchen voraussetzen, daß das PDF zunächst mit pdf2text in einen Text umgewandelt wird. :-) Folglich könntest Du also erst einmal Deine PDFs mit pdf2text konvertieren und dann sogar eine simple eigene Suchmaschine aufsetzen, z.B. ganz einfach mit der MySQL-Suche (MATCH ... AGAINST ...). Viele Grüße Lutz
php::bar PHP Wiki - Listenarchive