phpbar.de logo

Mailinglisten-Archive

[php] Suchmaschine Intranet

[php] Suchmaschine Intranet

Emilio Paolini ep_(at)_im-netz.de
Sun, 25 Jul 1999 16:55:18 +0200


mark.w100_(at)_gmx.de wrote:

>         Gesucht wird nicht über die TCP/IP sondern rekursiv auf dem
> Dateiverzeichnis des Servers nach .html files.
> 

>         Dabei habe ich <title>, <description>, <keywords> und den Dateinamen
>         extrahiert.
> 
>         Jetzt komme ich an den Punkt mich zu entscheiden ob ich die Daten als
>         ASCII (Array's) ablege oder eine Datenbank mit ins Spiel bringe.
> 
>         Bei Arrays wäre der Vorteil das ich per .js - Dateien die Index Datei,
>         welche die Tags enthalten, über Javascript parsen könnte.
> 
>         Datenbankanbindung z.B. mit mySQL denke ich mal schlucken Resourcen
>         und müßte dann über PHP3 eingelesen werden was auch wieder zu vermehrten
>         Serverzugriffen führen würde.
> 
>         Hat jemande Erfahrung mit Skripten die etwa 1000 - max. 2000 Homepage-
>         Tags parsen also etwa 3000-6000 Einträge ???
> 

Hmm, wir machen etwas entfernt aehnliches, wir suchen ebenfalls im
lokalen Filesystem rekursiv nach .html und anderen Files, um in diesen
Files bestimmte Strings zu finden. Die Anzahl der Files bzw 
Directories bewegt sich ebenfalls in relativ grossen Dimensionen
(etliche 10000e).

Hierbei ist das Hauptproblem das rekursive durchlaufen des Filesystems, 
also Directory oeffnen, Files parsen, unterverzeichnisse erkennen und
reinspringen.

Diese ganze Sache ist bei sovielen Files/Directories sehr langsam, sodass
wir ueberlegen, die Verzeichnisinformationen in mysql tables zu halten,
und ueber die tables auf die files zuzugreifen.

By(e) Emu

--
| Emilio Paolini <ep_(at)_IM-NETZ.de>......................... 13349 Berlin
| IM-NETZ Internet Services, Berlin............. http://www.IM-NETZ.de
| Telekom ...................... ++49 30 4511000 (Q) und 0177 451 2000


php::bar PHP Wiki   -   Listenarchive