Hallo,
Susanne Ebrecht schrieb:
> ISO-8859-1 unterstützt kein Eurozeichen.
Richtig. Dort wo Mircosoft das Eurozeichen in Windows-1252 hingepackt
hat, ist in ISO-8859-1 eigentlich nichts. Bei der Ausgabe in den Browser
ohne die Verwendung von UTF-8 oder Entities ist es bei Seitencodierung
in ISO-8859-1 reine Glückssache, ob der Browser des Gegenübers den
Bytewert Standard- oder Microsoftkompatibel (was ein Unwort) auswertet
/ anzeigt.
> Da das MySQL LATIN1 kein Standard Latin1 ist, sondern eigentlich
> Codepage 1252 ist hier in der Unix/Linux Welt Vorsicht angebracht. Das
> Standard LATIN1 unterstützt ebenfalls kein Eurozeichen.
Auch Richtig.
> Der Zeichensatz mit Eurozeichen heisst LATIN9. Dieser wurde bis jetzt
> von MySQL nicht unterstützt. Zukünftig wird MySQL 5.1 und höher (6.0,
>
> ...) Latin9 unterstützen. Entweder schon in der derzeit aktuellen
> Version oder aber es kommt mit der nächsten Version heraus.
Schön!
> Dennoch ist UTF8 hier die bessere Wahl. Der einzige Grund gegen UTF8
> war in Deutschland bislang die Collation. Auch hier hat sich etwas
> getan. Sowohl in 5.1 als auch in 6.0 wird es utf8_german2_ci
> (Telefonbuchsortierung (a=ae, u=ue, o=oe, ß=s) geben.
Das ist gut. Die neuen Collations sind in meiner Version des MySQL
Handbuchs noch nicht aufgeführt. Ich werde bei Gelegenheit mal updaten.
> Statt Query Browser würde ich hier MySQL Workbench empfehlen. MySQL ist
> dabei, den gesamten Umfang der alten GUI Tools (Query Browser,
> Administrator, Migration Toolkit) in Workbench zu implementieren. Query
> Browser trifft es hier als erstes.
Workbench läuft mir derzeit noch zu instabil (Windows Version). Hier ist
wohl noch etwas Geduld angesagt.
> Das liegt daran, dass es kaum Personen gibt, die sich damit auskennen.
> Für PostgreSQL und MySQL zusammen gibt es weltweit 5 Experten. Zwei
> deutsche (wobei einer hier mitlerweile nach Finland ausgewandert ist),
> ein Russe, ein Kanadier und ein Japaner.
:) so "dünn" hätte ich mir die Expertendecke nicht vorgestellt. Ich
hätte eher gedacht, dass alle, die sich damit näher beschäftigen,
einfach Besseres zu tun haben, als sich mit den dümmlichen Fragen von
Anfängern herumzuschlagen.
> Immer wieder schwierig ist es jedoch, das ganze native english Speakern
> beizubringen. Hier fehlt häufig einfach das Verständnis, dass es
> Sprachen gibt, die mehr Buchstaben, als a-z haben. Es ist mir durchaus
> schon passiert, dass ich nach mehreren Stunden Diskussion von einem
> amerikanischen Entwickler die Aussage bekam: "Ja aber utf8 und latin1
> ist doch dasselbe" ... In den ersten 7-bit hat er ja Recht, aber die
> interessieren bei dem Thema keinen.
:)
> Bei fast jeder größeren Open Source Veranstaltung reiche ich einen
> Vortrag zu dem Thema ein. Leider werden diese Vorträge häufig von den
> Orgas abgelehnt und stattdessen wählen die Orgas andere Vorträge von mir
> aus. Eine Orga hat mir als Begründung auf Nachfrage geantwortet: das
> Thema sei zu trocken, dafür würde sich kaum jemand interessieren.
Gerade hier in Europa ist dieses Argument blanker Unsinn. Wenn man hier
internationalisierte Anwendungen - sei es im Web oder aderer Natur -
entwickelt, kommt man nicht an erweiterten Zeichensätzen vorbei.
Allein die diakritischen Zeichen wie z.B. das Hatchek/Caron machen die
Sache schon interessant. Tschechisch, slowakisch, slowenisch, kroatisch,
finnisch, polnisch, serbisch, usw. Es würde wohl kaum UTF-8 geben, wenn
es irrelevant wäre. Die Orgas sollten sich mal an den Kopf fassen. Wenn
man die Engländer und Amerikaner abzieht, haben wohl die restlichen 5,5
Mrd. Menschen bestimmt ein Interesse an erweiterten Zeichensätzen.
> Meine Folien von Vorträgen zu dem Thema sollten sich jedoch alle im Netz
> finden lassen.
Hmmm. Vielleicht tauchen einfach nicht die richtigen Stichworte darin auf...
Bleibt zusammenfassend zu sagen, dass es zwei ganz gute und einfache
Wege gibt unter Windows wenigstens die gängigen deutschen Sonderzeichen
auf der Konsole nach MySQL hinein und wieder hinauszubekommen, ohne
Zeichensalat zu produzieren.
Die schönsten Varianten sind und bleiben natürlich Ein- und Ausgabe
durchgehend in UTF-8 mit entsprechenden Tools oder mit einer
UTF-8-fähigen Konsole in einem unixoiden OS.
Mit freundlichen Grüßen
Jürgen Schmitts