Mailinglisten-Archive |
Hallo Michael! Michael Niewiara schrieb am 13.05.2008 10:17: > Hallo Zusammen, > ich suche eine Möglichkeit Texte und ggf. Bilder aus einem Für Texte solltest Du Dir vielleicht mal das TET (PDFLib Text Extraction Toolkit) der PDFLib GmbH (http://www.pdflib.com/de/produkte/tet/) anschauen. Damit solltest Du zuverlässig an die Texte drankommen. > vorhandenen PDF zu extrahieren. Das ganze geht ein wenig in Richtung > PDF-Editor wobei ich im Grunde nur die Inhalte brauche. > Problematisch ist hierbei jedoch, dass die Texte teilweise > mehrspaltig layoutet sind. Wie es mit der Erkennung des "Spaltenwechsels" mit dem TET aussieht, müsstest Du selbst ausprobieren. Bevor Du lange nach der Doku vom TET suchst: Die Doku ist im Download-Paket enthalten: http://www.pdflib.com/de/download/tet/ Viele Grüße, ingo.
php::bar PHP Wiki - Listenarchive