Mailinglisten-Archive |
Um die Performance zu erhöhen, ist es grundsätzlich sinnvoll, diverse
Spalten auf mehrere Tabellen zu verteilen. Einige deiner Felder sind mir
allerdings nicht ganz klar. Was ist "visibility char(20)"? Wahrscheinlich
soll doch dort nur ein Y/N drinstehen. In diesem Fall nimm lieber ein
numerisches Feld, wo du 0/1 oder so einträgst.
In der Haupttabelle (oder Basistabelle = "dienewstabelle") sollten zunächst
nur die Felder auftauchen, die zur id einen 1:1-Bezug haben. Felder die
einen n:1 lassen sich ressourcensparend auslagern und n:m Beziehungen
sollten technisch immer über eine Hilfstabelle verknüpft werden. Teilweise
kompliziert sich hierzu zwar die Programmierung (keine sub-selects), aber
das kann ja noch kommen.
Beispiele:
#table basis, pk(basis_id)
basisid feld_a_1z1 feld_b_1z1 typ_id
1 ... ... 1
2 ... ... 1
3 ... ... 2
4 ... ... 3
5 ... ... 3
6 ... ... 3
7 ... ... 4
#table typen, pk(typ_id)
typ_id beschreibung
1 Tiere
2 Pflanzen
3 Autos
4 Getränke
Die Typ-Id läßt sich wunderbar joinen.
Um eine n:m-Beziehung auseinanderzubasteln brauchst Du eine Hilfstabelle.
Bezogen auf dich: Eine News hat mehrere Themen - ein Thema hat mehrere News.
Erstellen einer Themen-Tabelle:
#table themen , pk(themen_id)
themen_id Beschreibung
1 Prozessor
2 Grafikkarten
3 Mainboards
4 Speicher
5 Festplatten
6 Disketten
Erstellen einer Hilfstabelle
#table basis_themen, pk(basis_id, themen_id)
basis_id themen_id
1 1
1 2
1 6
2 1
3 1
3 4
4 3
4 5
usw.
Über diese Tabelle bekommst Du zum Beispiel sehr performant heraus, welche
basis_id hat und welche Themen haben welche basis_id.
Ich hoffe, das waren ein paar Anregungen für dich. Ganz wichtig: Eine
komplexe Datenbank entwirft man auf dem Papier, nicht im Kopf. Nimm dir also
ein Blatt Papier, einen Bleistift und einen Radiergummi und beginne Kästchen
und Pfeile zu malen. Eine von Anfang nicht oder schlecht durchdachte
Datenbankstruktur wird später mit Kompromissen leben müssen. Ist die
Datenbank einmal gefüllt, sind Strukturänderungen oft mit mehr Aufwand
verbunden, als am Anfang.
Außerdem wichtig! Viele Keys sind nicht immer gut, vor allem, wenn die
Tabelle sehr dynamisch sind, da der Verwaltungsaufwand schnell ansteigt.
Nicht immer ist es sinnvoll, daß die Abfrage 1sec dauert, dafür das Einfügen
oder ändern 1min. (wegen vieler Keys). Deshalb möglichst den statischen Teil
vom dynamischen Teil in verschiedene Tabellen packen.
Bei deinem Beispiel sind solche Felder wie zB. text,more,site statischer
Teile. Die kommen einmal rein und werden bis zum Löschen nicht mehr
verändert. Die Spalte Hits dagegen ist dynamisch (Anzahl der Abfragen?).
Obwohl das eine 1:1-Beziehung ist, ist es besser, die Hits in eine andere
Tabelle zu packen, zum Beispiel:
#table hits pk(basis_id)
basis_id hits
1 12
2 23
3 0
4 67
Überlegen solltest Du auch, was du mit dem "datestamp"-Feld erreichen
willst, den Zeitpunkt der Eintragung oder die letzte Aktualisierung oder die
letzte Abfrage. Für den Zeitpunkt der Eintragung nimmst du besser ein
date-feld, für den letzten hit packst du dann das datestamp-feld in die
obige Tabelle "Hits".
Naja, wie gesagt. Das sollen nur Anregungen sein. Weiß nicht, ob ich
Denkfehler drinnen habe.
Mfg. Sven Letzel.
-----Original Message-----
From: islistening_(at)_gmx.net [mailto:islistening_(at)_gmx.net]
Sent: Mittwoch, 22. September 1999 15:21
To: mysql-de_(at)_lists.4t2.com
Subject: Frage zum Aufbau einer table (ressourcen, performance)
Hallo Liste,
ich habe eine Frage zum moeglichst ressourcenschonenden Aufbau
einer Tabelle, dh moeglichst schnellen Zugriff. Es handelt sich
dabei Newsseiten verschiedener Websites, die von einem PHP-script
aus der MySQL-Datenbank generiert werden. Also ca 10.000 queries
am Tag. Fuer Expertenhinweise waere ich dankbar.
Nun habe ich noch wenig Erfahrung speziell im Erstellen von table
strukturen, die momentane Table sieht wie folgt aus:
CREATE TABLE dienewstabelle (
id int(11) DEFAULT '0' NOT NULL AUTO_INCREMENT,
text blob DEFAULT '' NOT NULL,
more blob DEFAULT '' NOT NULL,
datestamp datetime DEFAULT '0000-00-00 00:00:00' NOT NULL,
name varchar(100) DEFAULT '' NOT NULL,
email varchar(100) DEFAULT '' NOT NULL,
forumurl varchar (100),
hits int(11),
beitragstyp char(20) NOT NULL,
site char(20) NOT NULL,
thementyp char(20) NOT NULL,
visibility char(20) NOT NULL,
headline varchar(100) DEFAULT '' NOT NULL,
PRIMARY KEY (id),
KEY datestamp (datestamp),
KEY beitragstyp (beitragstyp),
KEY site (site),
KEY thementyp (thementyp),
KEY visibility (visibility)
);
Die News-Seiten werden jeweils nach einem QUERY_STRING generiert:
zB newsysadmin.php3?name=Heraklit&visibility=N&orderby=datestamp
Daraus bastelt das PHP-script dann eine korrespondierende SQL-query:
SELECT * FROM teamplaydenews WHERE name=Heraklit AND visibility=N ORDER
BY
datestamp
Weitere queries die so auch auftauchen koennten im taeglichen
Betrieb:
newsysadmin.php3?beitragstyp=kommentar&orderby=datestamp
newsysadmin.php3?beitragstyp=news&site=halflifede&orderby=datestamp
newsysadmin.php3?beitragstyp=news&site=halflifede&thementyp=mods&orderby=dat
estamp
newsysadmin.php3?name=jo&$beitragstyp=news&orderby=datestamp&limit=30
newsysadmin.php3?beitragstyp=news&orderby=datestamp&orderby2=thementyp
Was muss ich bei einem Orderby mit 2 Argumenten beachten? Kann man
die Tabellenstruktur so entwerfen, dass ein solches Orderby moeglichst
gewschwind von der Datenbank generiert wird? Hier soll eine Newssite
generiert werden die Thematisch geordnet ist, und dabei auch nach
Datum (ein Beispiel waere www.wallstreet-online.de).
Nun, wenn ich also im Moment die zusammengestellte SQL-Query so gegen
die Tabelle laufen lasse, bekomme ich bei allen WHERE abfragen die
Fehlermeldung *0 is not a MySQL result index*, das passiert bei allen
queries ausser wenn ich sowas wie *...WHERE id=1* uebergebe, dh mit
id funktionierts, bei anderen argumenten bekomme ich obige fehlermeldung.
Eine weitere Frage: wenn ich ORDER BY datestamp verwende, dann werden
die alten News zuerst ausgegeben. Wie kann ich erreichen, dass mir
fuer meine Newsseiten jeweils die aufsteigender reihenfolge sortiert
werden? ASC? DESC? Kann MySQL nach Datum ausgeben? Wie muss ich meine
table strukturieren, damit die *ORDER BY datestamp*-Ausgaben mit 2
argumenten besonders geschwind laufen?
Letzlich noch die Frage, ob ich ueberhaupt eine einzige Tabelle
verwenden sollte. Stellen schaetzungsweise 10000 Eintraege nach
einem Jahr ein Performanceproblem bei der Abfrage der Tabelle dar?
Wie sollte die oben dargestellte Tablestruktur besser aussehen, wenn
sie die Forderungen erfuellen soll? ich koennte mir vorstellen das
ich im table-entwurf etliche Anfaengerfehler gemacht habe.
Danke im Vorraus
--Heraklit
--
Sent through Global Message Exchange - http://www.gmx.net
---
*** Abmelden von dieser Mailingliste funktioniert per E-Mail
*** an mysql-de-request_(at)_lists.4t2.com mit Betreff/Subject: unsubscribe
---
*** Abmelden von dieser Mailingliste funktioniert per E-Mail
*** an mysql-de-request_(at)_lists.4t2.com mit Betreff/Subject: unsubscribe
php::bar PHP Wiki - Listenarchive