phpbar.de logo

Mailinglisten-Archive

[php] PDF-Inhalte importieren

[php] PDF-Inhalte importieren

Ingo Busch maillists at ibu-media.de
Die Mai 13 10:44:56 CEST 2008


Hallo Michael!

Michael Niewiara schrieb am 13.05.2008 10:17:
> Hallo Zusammen,
> ich suche eine Möglichkeit Texte und ggf. Bilder aus einem 

Für Texte solltest Du Dir vielleicht mal das TET (PDFLib Text Extraction 
Toolkit) der PDFLib GmbH (http://www.pdflib.com/de/produkte/tet/) 
anschauen. Damit solltest Du zuverlässig an die Texte drankommen.

> vorhandenen PDF zu extrahieren. Das ganze geht ein wenig in Richtung 
> PDF-Editor wobei ich im Grunde nur die Inhalte brauche. 
> Problematisch ist hierbei jedoch, dass die Texte teilweise 
> mehrspaltig layoutet sind.

Wie es mit der Erkennung des "Spaltenwechsels" mit dem TET aussieht, 
müsstest Du selbst ausprobieren.

Bevor Du lange nach der Doku vom TET suchst: Die Doku ist im 
Download-Paket enthalten: http://www.pdflib.com/de/download/tet/

Viele Grüße,

ingo.

php::bar PHP Wiki   -   Listenarchive