Mailinglisten-Archive |
Ingo Busch schrieb: >Albin Blaschka schrieb: > > > >>um zum eigentlichen Thema zurückzukommen: >> >>Unter Linux gibt's ja das set an Programmen >>pdf2ps, pdftotext usw... unter windows müßte sich mit Ghostscript >>vielleicht auch was basteln lassen... >> >>http://www.cs.wisc.edu/~ghost/doc/AFPL/get853.htm >> >> > >Wenn es "nur" um das Auslesen der Textinhalte geht, dann hilft >vielleicht das PDFLib Text Extraction Toolkit von pdflib.com > >http://www.pdflib.com/de/produkte/tet/index.html > >weiter. Und dann kann man sich auch die Texte vorlesen lassen ;-) > komme erst nun dazu zur Kenntnis zu nehmen, was ich hier losgetreten habe. Immerhin ein Hinweis :-) noch 'mal zum Sinn der Anfrage: "Konvertieren" war genaugenommen einen Schritt zu weit gedacht. Eigentlicher Zweck waere das Parsen der PDF-Inhalte zur Weiterverwertung mit HTML oder Ablegen in einer Datenbank. Ausserdem ggf. zur Anwendung einer Suchfunktion auf den Text. Wenns da noch was Fertiges gaebe, waers angenehm. Gruss / GW
php::bar PHP Wiki - Listenarchive