Mailinglisten-Archive |
On Tue, 25 Jul 2000, Dieter Rößing wrote: Hi Dieter, > ich stehe vor der Aufgabe eine Volltextsuche zu entwickeln. Dabei sollen > Dateien verschiedener Formate z. B. *.doc, *.pdf, *.xls, *.txt nach > Inhalten durchsucht werden. > > Das Problem sind die verschiedenen Formate. *schluck* Das ist ja alles wild durcheinander. O.K. ich wuerde ASCII als Basis nehmen. Auf Unix Systemen gibt es allerhand Filter fuer solche Formate die man im Batch betrieb nutzen kann. Dann wuerde ich von jeder Datei eine ASCII Kopie machen und dann bei Files (orgninal und ASCII kopie) irgendwie in einer DB verknuepfen. Die Filter findest Du mit ziemlicher Sicherheit auf www.freshmeat.net. Cu, Sven BTW: Nur fuer den Fall das Du Wintendo benutzt: Da siehts mit sowas duester aus.
php::bar PHP Wiki - Listenarchive