Mailinglisten-Archive |
Hi Stefan, Zitat von Stefan Sturm: > ich habe da derzeit ein Projekt, in dem folgendes Gefragt ist: > > Durch ein Script soll ein Verzeichnisbaum durchsucht werden und alle > gefundenen Dateien in eine DB gespeichert werden. Von diesen Dateien(wenn > das möglich ist) sollen zwei Vorschaubilder erstellt werden. Das ist ja > eigentlich kein Problem. > Nun können in diesem Verzeichnis aber mehrere Hunderttausend Bilder und > PDF's liegen. Und diverse davon sind sehr groß, es ist also mit sehr viel > Rechenzeit zu erstellen der Vorschaubilder zu rechnen. > > Ich hatte mir da folgende Vorgehensweise überlegt: > Ich mache das ganze in zwei Schritten. Ein Script(gestartet per cronjob) > durchsucht die Verzeichnisse und überprüft, ob das Bild bereits vorhanden > ist. Sollte das nicht der Fall sein, wird es in der DB gespeichert und ein > Merker gesetzt, dass von diesem Bild eine Vorschau erstellt werden muss. > Das zweite Script wird auch per cronjop gestartet (jede Sekunde?) und holt > sich aus der DB genau eine Datei, bearbeitet diese und setzt dann den Merker > wieder zurück. Auf diese Weise möchte ich ein Script vermeiden, das ewig > lange läuft und so mächtig Ressourcen frist. > Nur könnte ich damit auf andere Probleme stoßen? Z.B. das zu viele Dateien > gleichzeitig bearbeitet werden? > > Vielleicht hat hier ja jemand so was in dieser Art schon mal gemacht und > kann mir ein paar Tipps geben... also ganz wichtig finde ich: Ich wuerde im Normalfall keine Bilder und Binaerdaten in der Datenbank ablegen, sondern nur Referenzen auf die Bilder, d.h. Pfade und Dateinamen. Alles andere geht meiner Ansicht nach arg auf die Performanz, zumal wenn Du von mehreren Hunderttausend Bildern sprichst und viele Seitenzugriffe hast. Zweiter Punkt: Ob Deine Vorgehensweise ansonsten passt oder nicht, haengt etwas von Deiner Anwendung ab. Worum geht es denn genau? Es gibt Faelle, wo man sicher so vorgehen kann, es gibt aber auch Faelle, wo ich es anders machen wuerde. Also wie sieht Dein "Fall" denn aus? :-) Viele Gruesse Lutz
php::bar PHP Wiki - Listenarchive