Mailinglisten-Archive |
Hallo Norbert, > ABER: > Stellt Euch doch mal den sehr realen Fall vor, dass die Dokumente in > gemischter Form vorliegen, also bunt durcheinander HTML-, mit und ohne > SSI, PHP-Seiten und auch noch die eine oder andere MySQL- bzw. ASCII- > Datenbank mit Perl- oder PHP-Frontend. Die Inhalte wiederzufinden, ist nicht unbedingt das Problem, da Du explizit ASCII-Retrieval machst. Egal ob in oder ausserhalb der DB. Das entscheidende Problem ist imho, die Repräsentatonsstrukturen korrekt aufzubauen, d.h. was habe ich davon, daß ich weiss, dass in DB X in table Y und Record Z Daten xyz stehen? Nichts, wenn ich nicht das Repraesentationsfrontend aufrufe, das die relationalen Strukturen herstellt. Es sei denn, ich kann das in die Suchmaschine integrieren :-= > Goessere Intranets wachsen langsam und nie nach einem festgelegten Muster, > da koennen auch CGI-Abfragen drin sein, die aus Zeiten stammen als noch > niemand an PHP und MySQL dachte. Bleistiftsweise das. UND: ;-) Wenn man ein bisschen ueber den ASCII/HTML-Tellerrand rausguckt, kommt die Frage nach den Dokumentformat-Interfaces. Kann PHP eigentlich ein PDF-Dokument vollstaendig parsen? Was ist mit Dokumenten, die in einer anderen Struktur vorliegen, z.B. Excel, Winword, Lotus WordPro usw... Da gibt es zwar eine Search Engine), die das kann, die ist aber a bisserl teuer. Ich kann mir kaum vorstellen, dass man das alles ohne geordnetes Dokumentenmanagement auf die Reihe kriegt. Das wiederum sollte mit PHP + DB kein Problem sein. Wobei mich eher das Frontend fuer den Input etwas nachdenklich stimmt. Aber das wird OT. Mit freundlichen Grüßen, Oliver Kummerow email: naklar_(at)_altavista.net
php::bar PHP Wiki - Listenarchive