phpbar.de logo

Mailinglisten-Archive

[php] tag cloud/key word density Ansätze

[php] tag cloud/key word density Ansätze

Henning Heil lists at h-quadrat.com
Mit Aug 2 21:04:50 CEST 2006


Hallo Lutz,

ich versuche Deinen Beitrag noch zu verstehen,

++++ Lutz Zetzsche wrote on 02.08.2006 09:21 ++++
> Hallo Henning,
>
> Am Mittwoch, 2. August 2006 01:50 schrieb Henning Heil:
>   
>> ich habe gerade eine ganze Weile gegoogelt, aber irgendwie kein
>> vernünftiges tag cloud / keyword density Skriptgefunden. Hier das sah
>> mir ganz vernünftig aus
>>
>> http://jowra.com/journal/2006/02/tag-clouds-hmmm-delicious/
>> http://jowra.com/journal/2006/02/wordpress-plugin-delicious-tag-cloud
>> -ii/
>>
>> Ich würde das Teil aber gerne manuell befüllen, also mit einer
>> einfach Tabelle a la <keyword/tag> und <Priorität> oder
>> <Wichtigkeit>. Kennt da jemand was bzw. hat einen Ansatz?
>>
>> Danke & VG,
>>     
ich lasse mal den full quote stehen, da ich noch drüber nachdenke
> es beantwortet zwar nicht Deine Frage, aber ich möchte Dir kurz meine 
> Gedanken zu diesem Thema zusammenfassen. Vielleicht bringt Dich das 
> noch auf neue Ideen.
>
> Hinter den Wortwolken, die im Prinzip ja nur eine Darstellungsform sind, 
> steht nichts anderes als eine Verschlagwortung in Form eines Indexes. 
> Jedes gute Buch hat sowas schon seit Jahrzehnten, ich würde fast schon 
> sagen, seit Jahrhunderten. Also ein ganz altes Prinzip. (Nur als 
> Anmerkung: Auch die Wortdichte kann man in Buchindexen ersehen, nämlich 
> an der Zahl der Seitenzahlen hinter einem Schlagwort. :-D)
>
> Der oben von Dir genannte Artikel stellt Kategorien und Wortwolken 
> gegenüber. Kategorien seien schlecht, Wortwolken seien gut... 
> Kategorien und Index sind aber aus meiner Sicht keine Gegensätze, 
> sondern einfach nur zwei verschiedene Zugänge zu Daten. Kategorien 
> würde ich also analog als Verschlagwortung in Form einer Hierarchie 
> definieren.
>
> Der im Artikel genannte Grund, warum Wortwolken gut, Kategorien aber 
> schlecht sein sollen, trifft aber - das ist der entscheidende 
> Denkfehler in dem Artikel und der entscheidende Mangel der derzeitigen 
> Wortwolkensysteme - auch auf Wortwolken zu. Denn: Auch wenn man es 
> Schlagwort oder Tag nennt, es ist logisch mit einer Kategorie 
> gleichzusetzen. Irgendwann wir ein einzelnes Tag als Verschlagwortung 
> genauso unspezifisch wie die Zuordnung zu einer einzigen Kategorie.
>
> Der grundsätzliche Unterschied zwischen der konventionellen 
> Kategorisierung und den Wortwolken ist, daß Du bei der konventionellen 
> Kategorisierung die Hierarchie vorab definieren mußt. Sie ist damit 
> statisch. Bei Mehrfachrelationen mußt Du die Kategorien an 
> verschiendenen Stellen in den Hierarchiebaum einhängen und Daten 
> entsprechend auch mehrfach zuordnen. Da steckt sehr viel Redundanz und 
> Arbeit drin. Dieses Problem hast Du bei Wortwolken nicht. Sie sind 
> absolut dynamisch.
>
> Die Wortwolkensysteme haben derzeit den Fehler, daß sie nicht 
> mehrfachverschlagwortend wie eine Hierarchie von Kategorien sind. Im 
> Augenblick ist es so, daß Du Dich von Wortwolke zu Wortwolke bewegst 
> und dabei zwischen Wortwolke und Tag eine 1:1-Beziehung besteht. Um 
> sich in großen Datenmengen sinnvoll zu bewegen, bräuchte es eine 
> 1:n-Beziehung, d.h. Du kannst x Tags angeben bzw. x Wortwolken 
> durchlaufen und bekommst (am Ende) die resultierende Wortwolke.
>
> Soweit ich mich erinnere, ist das Problem aber mittlerweile erkannt und 
> eine Lösung in Arbeit. :-) Eigentlich hätte man von Anfang an darauf 
> kommen können, aber vielleicht ist man auf seinen eigenen unsäglichen 
> Marketing-Schlagworten ausgerutscht. Wer von Tags, Tagging und Word 
> Clouds redet, wo es im Kern eigentlich um Schlagworte, Verschlagwortung 
> und Kategorisierung bzw. Wortbeziehungen geht, der kann schon mal 
> verloren gehen... :-D
>   
so, also ich glaube ich bin so langsam dahinter gestiegen, ich habe das 
vielleicht etwas in eine andere Richtung gemeint und genau genommen vor 
den von Dir beschriebenen Schwierigkeiten die Kurve gekratzt: ich will 
garnicht irgendwo auswerten, kummulieren oder n:m Beziehungen haben 
(meine Freundin ist anstrengend genug ;-)), Spass bei Seite: es ging mir 
nur um die Darstellung in so einer Wolke.

Befüllen will ich das Skript mehr als einfach, in einer simplen Tabelle 
mit zwei Spalten: keyword und Wichtigkeit. Und dann soll mir so eine 
Wolke generiert werden. Ich will das garnicht in ein anderes Skript oder 
in eine Datenbank einbinden, nur eine einfach Tabelle als Datenbasis. 
Ich glaube aber mittlerweile, dass man das so umbauen kann, css und 
Ausgabe sind ja vorhanden und dann trickse ich etwas.

Dachte halt, dass muss es doch fertig geben ... :-).

Viele Grüsse,

Henning


php::bar PHP Wiki   -   Listenarchive