phpbar.de logo

Mailinglisten-Archive

[php] [RE] Filesystem vs. DB

[php] [RE] Filesystem vs. DB

Napolitano, Axel php_(at)_phpcenter.de
Tue, 23 Oct 2001 10:00:37 +0200


Hallo,


ich kann die ganze Diskussion leider nicht mehr ernst nehmen, da sie
sich mittlerweile dem Niveau einer "Linux ist besser als
Windows"-Diskussion n=E4hert.

Ich habe hier viele theoretische Aussagen gelesen und mir auch die
(wenngleich nicht wirklich praxisnahen) Benchmarks angesehen.

Faktum ist, das die Anforderungen entscheidend sind. Ich habe hier im
Rahmen der Vorbereitung unseres inhouse Media-Asset-Systems umfangreiche
Tests sowohl auf Filesystem-Ebene als auch auf Datenbankebene
durchgef=FChrt.

Die Ergebnisse sprechen ohne Ausnahme f=FCr die Datenbankl=F6sung.

Ein kleiner Test:

Einfach mal ein Verzeichnis ("/db_name/tb_name/")anlegen und dann viele
(bei uns sind es derzeit 167.211) Dateien in diesem Verzeichnis anlegen.
Die Durchschnittsgr=F6=DFe der Dateien betr=E4gt 45KByte (Das alleine =
ist
schon ein ziemliche Brocken an Daten). Pro Jahr kommen etwa 18.000 bis
20.000 Dokumente weltweit hinzu. Diesen Daten sind noch einmal die
gleiche Menge Thumbnails zugeordnet (durchschnittsgr=F6=DFe 2,5Kbyte)

Um das Szenario zu Ende zu spielen:

Gleichzeitig eine Datenbank anlegen und dort genau die gleiche
Datenmenge ablegen.

Spasshalber kann jetzt mal versucht werden, eine definierte Datei
innerhalb dieser Dateiw=FCste zu finden - am besten auch (auch wenn es
hier viele Linux-User gibt) mit dem Windows-Explorer (Kaffee nicht
vergessen)

Um die Sache noch spannender zu machen:

Die Datenbasis soll innerhalb einer Firma mit derzeit33 Standorten in
mehreren L=E4ndern (nicht auf Europa beschr=E4nkt) genutzt werden. Es
existieren konstant mindestens 1.300 Clients, die im Schnitt 2.000/2.700
Zugriffe am Tag durchf=FChren. Um Ausf=E4llen und Engp=E4ssen =
vorzubeugen
existiert ein zweiter Server, der die Daten spiegelt. Beide Server sind
geografisch getrennt. Neuzug=E4nge/Abg=E4nge werden nachts bzw. in den
jeweiligen B=FCroschlusszeiten repliziert. Es muss m=F6glich sein, nach
Belieben weitere Server zu integrieren.

Die Daten m=FCssen mittels eines WebFrontends und =FCber eine speziell
entwickelte Recherche-Software, welche in alle bei uns verwendeten
Applikationen als "AddIn" integriert ist zur Verf=FCgung stehen.

F=FCr jede Datei werden alle Bearbeitungsschritte gesichert. D.h. das es
mehrere Versionen einer Datei geben kann (rudiment=E4res =
Versionstracking)

Viele Daten sind vertraulich und d=FCrfen daher auch in keinem Fall =
f=FCr
Unbefugte verf=FCgbar sein - auch bei einem potenziellen Hackerangriff
m=FCssen die Daten hinreichend sicher sein (die H=FCrde an die Daten
heranzukommen muss sehr hoch sein).

Wenn jetzt jemand eine (praktikable) L=F6sung hat, diese Anforderungen =
mit
einer Filesystem-Basierten Ablage zu realisieren, m=F6ge er sich melden.

Zum Schluss noch eines: F=FCr eine Handvoll Dateien lohnt sich das
Speichern in einer Datenbank kaum - das will ich nicht bestreiten. Bei
derart massiven Datenmengen und Anforderungen ist es jedoch nicht
sinnvoll, sich mit dem Filesystem zu besch=E4ftigen.=20
=20

Gru=DF

Axel Napolitano





php::bar PHP Wiki   -   Listenarchive