phpbar.de logo

Mailinglisten-Archive

y==ü im Schwedischen?
Archiv Mailingliste mysql-de

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

y==ü im Schwedischen?



Grüß Euch,

ich hatte kürzlich die Version 3.22.16a-gamma installiert (unter
Solaris 2.6 auf einer Sun Ultra mit egcs 1.1.1) und dann festgestellt,
daß plötzlich beim Einfügen von Datensätzen Duplikate erkannt wurden,
wo eigentlich keine waren:

   MySQL schien die Zeichen 'y' (Ypsilon)
                        und 'ü' (ue, u-Umlaut) als gleich zu
   behandeln!

Also wenn z.B. "Myder" als Schlüssel vorhanden war, konnte man keinen
Datensatz mit "Müder" einfügen, da angeblich ein Duplicat.

Ich habe inzwischen V3.22.19b installiert und bei dieser zusätzlich
die configure-Option "--with-charset=german1" angegeben.

Das geschilderte Problem ist nun weg, wie's aussieht.  Ich mußte nur -
wie im Handbuch beschrieben, die von der 3.22.16a erzeugten Tabellen
mit 'isamchk' neu indizieren.  Bei neu erzeugten Tabellen scheint nun
alles von Haus aus okay zu sein.


Ich bin nun aber etwas unsicher, was eigentlich die Ursache des
Problems war und ob ich es wirklich gelöst habe.  Deshalb meine
Fragen an Euch:

- Hatte eine/einer von Euch auch schon dieses Problem?

- War das ein Bug in der Version 3.22.16a-gamma?
  (In der Change-History erwähnt Monty allerdings nichts derart.)

- Oder lag es daran, daß die configure-Option "--with-charset=german1"
  fehlte?

  Wenn ja, sollte nicht eigentlich gemäß Handbuch iso-8859-1 die
  Standardkodierung sein?  Und da sollten doch alle Zeichen auch
  als verschieden behandelt werden ...

  Irgendwo meine ich auch gelesen zu haben, daß das Default die
  schwedische Sortierordnung sein soll, kann aber leider die Quelle
  nicht mehr finden.

- Was _genau_ bewirkt man eigentlich mit den verschiedenen Einstellungen
  bei "--with-charset=..."?  Im Handbuch steht wirklich nicht viel
  (oder hab ich noch was übersehen?):

  | 9.1.1 The character set used for data and sorting
  | 
  | By default, MySQL uses the ISO-8859-1 (Latin1) character set. This
  | is the character set used in the USA and western Europe.
  | 
  | The character set determines what characters are allowed in names
  | and how things are sorted by the ORDER BY and GROUP BY clauses of
  | the SELECT statement.
  | 
  | You can change the character set at compile time by using the
  | --with-charset=charset option to configure. See section 4.7.1
  | Quick installation overview.

  Es ist nicht unbedingt klar, ob die Sortierreihenfolge auch die
  Erkennung von Duplikaten beeinflußt ...


Wäre wirklich schön, wenn eine/einer ein bißchen Licht in mein Dunkel
bringen könnte.  Vielen Dank schon mal!

Ciao,
  Martin
-- 
Martin Ramsch <m.ramsch_(at)_computer.org> <URL: http://home.pages.de/~ramsch/ >
PGP KeyID=0xE8EF4F75 FiPr=52 44 5E F3 B0 B1 38 26  E4 EC 80 58 7B 31 3A D7


Home | Main Index | Thread Index

php::bar PHP Wiki   -   Listenarchive