phpbar.de logo

Mailinglisten-Archive

[php] Suchmaschine Intranet

[php] Suchmaschine Intranet

Emilio Paolini ep_(at)_im-netz.de
Mon, 26 Jul 1999 17:47:24 +0200


Norbert Pfeiffer wrote:

> >> Hierbei ist das Hauptproblem das rekursive durchlaufen des Filesystems,
> >> also Directory oeffnen, Files parsen, unterverzeichnisse erkennen und
> >> reinspringen.
> kannst Du das Problem mal naeher erlaeutern ?

Kein "richtiges" Problem, nur aus PHP heraus relativ langsam. Wenn ich
z.B. in tausenden von (unter)Verzeichnissen ein replace in .html
Files machen moechte, und mir die Files erst in diesem moment aus
den Unterverzeichnissen zusammensuche, dann dauert die Suche eben
die meisste Zeit, waehrend die Ersetzung (oder das finden )jeweils 
sehr schnell ist. 

> 
> Als Ergebnis willst Du sicher etwas in dieser Art:
> http://www.web-as.de/workshop/diese_Site.php3
> Okay, dieser Server ist nicht sonderlich gegliedert, aber das Script
> tut es auch in meinem Intranet und da herrscht das blanke Chaos  :-)

Noe, ich will die Files nicht auflisten, sonndern halt nur einige
Sachen finden und/oder replacen. Vieleicht ist auch garnicht mal
das rekursive Scannern der Verzeichnisse aus PHP das Nadeloehr,
sondern einfach der grundsaetzliche Zugriff auf tausende von
Verzeichissen ueber das (Linux) Filesystem.

Wir werden wohl in irgendeiner Form indizieren, oder noch besser
die Verzeichnissinformation in einer mysql halten muessen.

Gegen eine periodische Indizierung (z.B.: mit htdig) spricht, dass 
dann der Zustand des Filesystems und der des Indexes nicht zu 
jederzeit synchron sind. Bei einer mysql koennte ich das aus PHP 
heraus synchron halten.

MfG Emilio

--
| Emilio Paolini <ep_(at)_IM-NETZ.de>......................... 13349 Berlin
| IM-NETZ Internet Services, Berlin............. http://www.IM-NETZ.de
| Telekom ...................... ++49 30 4511000 (Q) und 0177 451 2000


php::bar PHP Wiki   -   Listenarchive