phpbar.de logo

Mailinglisten-Archive

[php] Volltextsuche auch in PDF-Dokumenten

[php] Volltextsuche auch in PDF-Dokumenten

Lutz Zetzsche Lutz.Zetzsche at sea-rescue.de
Fre Okt 13 11:46:12 CEST 2006


Hi Andre,

Am Freitag, 13. Oktober 2006 11:40 schrieb Andre Wagner:
> Hallo,
>
> kennt jemand ein Tool, mit dem ich ein Webseite durchsuchen kann? In
> einer Webseite die (leider) aus statischem HTML besteht soll eine
> Volltextsuche integriert werden. Hierzu habe schon etwas gefunden:
>
> http://www.planetc.de/download/planetsearch/planetsearch.html
>
> Zusätzlich sollen aber auch PDF Dokumente durchsucht werden. Kennt
> jemand eine Anwendung die das schon erfüllt, oder ist wieder
> "irgendwie selbermachen" angesagt?

im Prinzip können das alle die namhaften Suchen, die mir gerade 
einfallen:

	ht://Dig:
	http://www.htdig.org/FAQ.html#q4.9

	mnoGoSearch:
	http://www.mnogosearch.org/winhelp/ch16s03.html

	Lucene:
	http://www.jguru.com/faq/view.jsp?EID=862443

Wenn Du Dir aber die drei Seiten anguckst, wirst Du feststellen, daß 
alle drei Suchen voraussetzen, daß das PDF zunächst mit pdf2text in 
einen Text umgewandelt wird. :-)

Folglich könntest Du also erst einmal Deine PDFs mit pdf2text 
konvertieren und dann sogar eine simple eigene Suchmaschine aufsetzen, 
z.B. ganz einfach mit der MySQL-Suche (MATCH ...  AGAINST ...).

Viele Grüße
Lutz

php::bar PHP Wiki   -   Listenarchive