phpbar.de logo

Mailinglisten-Archive

[php] Durchsuchen von PDF-Files

[php] Durchsuchen von PDF-Files

Joerg Behrens php_(at)_phpcenter.de
Mon, 11 Feb 2002 16:13:52 +0100


Moin,

----- Original Message -----
From: "Egon Schmid" <eschmid_(at)_php.net>
To: <php_(at)_phpcenter.de>
Sent: Monday, February 11, 2002 3:25 PM
Subject: Re: [php] Durchsuchen von PDF-Files


> From: "Sönke Matz" <soenkematz_(at)_schleswiger-husaren.de>
>
> > Gibt es irgendeine Möglichkeit mit PHP den Inhalt von PDF-Files zu
> > durchsuchen?
>
> Ja, z.B. mit ht://Dig. Ist zwar nicht ganz PHP, aber damit klappt es
> ganz gut.

Jein, weder htdig, mnogosearch und Konsorten koennen das selber. Dort wird
nur mimetype mit externen Parsern(Konverter) verknuepft was also nichts
weiter ist als ein externes Programm dafuer zubemuehen.

Also kann du das auch gleich direkt mit exec() machen. Je nach Dokumenttyp
muss man schauen wie das mit den Konvertern so ist.. gerade bei PDF ist das
alles mittelpraechtig. Erkennung des Titels ist schon eine Sache fuer sich
und Umlaute koennen auch ein Problem darstellen.

Schau halt was freshmeat/google so ausspukt bei pdf2html | text .

Gruss
Joerg Behrens

--
TakeNet GmbH                        Mobil: 0171/60 57 963
D-97080 Wuerzburg                 Tel: +49 931 903-2243
Alfred-Nobel-Straße 20            Fax: +49 931 903-3025


php::bar PHP Wiki   -   Listenarchive