Mailinglisten-Archive |
Moin, ----- Original Message ----- From: "Egon Schmid" <eschmid_(at)_php.net> To: <php_(at)_phpcenter.de> Sent: Monday, February 11, 2002 3:25 PM Subject: Re: [php] Durchsuchen von PDF-Files > From: "Sönke Matz" <soenkematz_(at)_schleswiger-husaren.de> > > > Gibt es irgendeine Möglichkeit mit PHP den Inhalt von PDF-Files zu > > durchsuchen? > > Ja, z.B. mit ht://Dig. Ist zwar nicht ganz PHP, aber damit klappt es > ganz gut. Jein, weder htdig, mnogosearch und Konsorten koennen das selber. Dort wird nur mimetype mit externen Parsern(Konverter) verknuepft was also nichts weiter ist als ein externes Programm dafuer zubemuehen. Also kann du das auch gleich direkt mit exec() machen. Je nach Dokumenttyp muss man schauen wie das mit den Konvertern so ist.. gerade bei PDF ist das alles mittelpraechtig. Erkennung des Titels ist schon eine Sache fuer sich und Umlaute koennen auch ein Problem darstellen. Schau halt was freshmeat/google so ausspukt bei pdf2html | text . Gruss Joerg Behrens -- TakeNet GmbH Mobil: 0171/60 57 963 D-97080 Wuerzburg Tel: +49 931 903-2243 Alfred-Nobel-Straße 20 Fax: +49 931 903-3025
php::bar PHP Wiki - Listenarchive