phpbar.de logo

Mailinglisten-Archive

[php] Suchmaschine Intranet

[php] Suchmaschine Intranet

Oliver Kummerow naklar_(at)_altavista.net
Mon, 26 Jul 1999 08:25:18 +0200


Hallo Norbert,

> ABER:
> Stellt Euch doch mal den sehr realen Fall vor, dass die Dokumente in
> gemischter Form vorliegen, also bunt durcheinander HTML-, mit und ohne
> SSI, PHP-Seiten und auch noch die eine oder andere MySQL- bzw. ASCII-
> Datenbank mit Perl- oder PHP-Frontend.

Die Inhalte wiederzufinden, ist nicht unbedingt das Problem, da Du
explizit ASCII-Retrieval machst. Egal ob in oder ausserhalb der DB. Das
entscheidende Problem ist imho, die Repräsentatonsstrukturen korrekt
aufzubauen, d.h. was habe ich davon, daß ich weiss, dass in DB X in
table Y und Record Z Daten xyz stehen? Nichts, wenn ich nicht das
Repraesentationsfrontend aufrufe, das die relationalen Strukturen
herstellt. Es sei denn, ich kann das in die Suchmaschine integrieren :-=

> Goessere Intranets wachsen langsam und nie nach einem festgelegten Muster,
> da koennen auch CGI-Abfragen drin sein, die aus Zeiten stammen als noch
> niemand an PHP und MySQL dachte.

Bleistiftsweise das.

UND: ;-)
Wenn man ein bisschen ueber den ASCII/HTML-Tellerrand rausguckt, kommt
die Frage nach den Dokumentformat-Interfaces. Kann PHP eigentlich ein
PDF-Dokument vollstaendig parsen? Was ist mit Dokumenten, die in einer
anderen Struktur vorliegen, z.B. Excel, Winword, Lotus WordPro usw... Da
gibt es zwar eine Search Engine), die das kann, die ist aber a bisserl
teuer.

Ich kann mir kaum vorstellen, dass man das alles ohne geordnetes
Dokumentenmanagement auf die Reihe kriegt. Das wiederum sollte mit PHP +
DB kein Problem sein. Wobei mich eher das Frontend fuer den Input etwas
nachdenklich stimmt. Aber das wird OT.


Mit freundlichen Grüßen,
Oliver Kummerow
email: naklar_(at)_altavista.net


php::bar PHP Wiki   -   Listenarchive