List:German« Previous MessageNext Message »
From:f4ckm5 Date:April 1 2009 9:10pm
Subject:Re: Deutsche Umlaute und UTF8
View as plain text  
Hallo,

Susanne Ebrecht schrieb:

> ISO-8859-1 unterstützt kein Eurozeichen.
Richtig. Dort wo Mircosoft das Eurozeichen in Windows-1252 hingepackt 
hat, ist in ISO-8859-1 eigentlich nichts. Bei der Ausgabe in den Browser 
ohne die Verwendung von UTF-8 oder Entities ist es bei Seitencodierung 
in ISO-8859-1 reine Glückssache, ob der Browser des Gegenübers den 
Bytewert  Standard- oder Microsoftkompatibel (was ein Unwort) auswertet 
/ anzeigt.

> Da das MySQL LATIN1 kein Standard Latin1 ist, sondern eigentlich 
> Codepage 1252 ist hier in der Unix/Linux Welt Vorsicht angebracht. Das 
> Standard LATIN1 unterstützt ebenfalls kein Eurozeichen.
Auch Richtig.

> Der Zeichensatz mit Eurozeichen heisst LATIN9. Dieser wurde bis jetzt 
> von MySQL nicht unterstützt. Zukünftig wird MySQL 5.1 und höher (6.0,
> 
> ...) Latin9 unterstützen. Entweder schon in der derzeit aktuellen 
> Version oder aber es kommt mit der nächsten Version heraus.
Schön!

> Dennoch ist UTF8 hier die bessere Wahl.  Der einzige Grund gegen UTF8 
> war in Deutschland bislang die Collation.  Auch hier hat sich etwas 
> getan. Sowohl in 5.1 als auch in 6.0 wird es utf8_german2_ci 
> (Telefonbuchsortierung (a=ae, u=ue, o=oe, ß=s) geben.
Das ist gut. Die neuen Collations sind in meiner Version des MySQL 
Handbuchs noch nicht aufgeführt. Ich werde bei Gelegenheit mal updaten.

> Statt Query Browser würde ich hier MySQL Workbench empfehlen. MySQL ist 
> dabei, den gesamten Umfang der alten GUI Tools (Query Browser, 
> Administrator, Migration Toolkit) in Workbench zu implementieren. Query 
> Browser trifft es hier als erstes.
Workbench läuft mir derzeit noch zu instabil (Windows Version). Hier ist 
wohl noch etwas Geduld angesagt.

> Das liegt daran, dass es kaum Personen gibt, die sich damit auskennen. 
> Für PostgreSQL und MySQL zusammen gibt es weltweit 5 Experten. Zwei 
> deutsche (wobei einer hier mitlerweile nach Finland ausgewandert ist),  
> ein Russe, ein Kanadier und ein Japaner.
:) so "dünn" hätte ich mir die Expertendecke nicht vorgestellt. Ich 
hätte eher gedacht, dass alle, die sich damit näher beschäftigen, 
einfach Besseres zu tun haben, als sich mit den dümmlichen Fragen von 
Anfängern herumzuschlagen.

> Immer wieder schwierig ist es jedoch, das ganze native english Speakern 
> beizubringen. Hier fehlt häufig einfach das Verständnis, dass es 
> Sprachen gibt, die mehr Buchstaben, als a-z haben. Es ist mir durchaus 
> schon passiert, dass ich nach mehreren Stunden Diskussion von einem 
> amerikanischen Entwickler die Aussage bekam: "Ja aber utf8 und latin1 
> ist doch dasselbe" ... In den ersten 7-bit hat er ja Recht, aber die 
> interessieren bei dem Thema keinen.
:)

> Bei fast jeder größeren Open Source Veranstaltung reiche ich einen 
> Vortrag zu dem Thema ein. Leider werden diese Vorträge häufig von den 
> Orgas abgelehnt und stattdessen wählen die Orgas andere Vorträge von mir 
> aus. Eine Orga hat mir als Begründung auf Nachfrage geantwortet: das 
> Thema sei zu trocken, dafür würde sich kaum jemand interessieren.
Gerade hier in Europa ist dieses Argument blanker Unsinn. Wenn man hier 
internationalisierte Anwendungen - sei es im Web oder aderer Natur - 
entwickelt, kommt man nicht an erweiterten Zeichensätzen vorbei.
Allein die diakritischen Zeichen wie z.B. das Hatchek/Caron machen die 
Sache schon interessant. Tschechisch, slowakisch, slowenisch, kroatisch, 
finnisch, polnisch, serbisch, usw. Es würde wohl kaum UTF-8 geben, wenn 
es irrelevant wäre. Die Orgas sollten sich mal an den Kopf fassen. Wenn 
man die Engländer und Amerikaner abzieht, haben wohl die restlichen 5,5 
Mrd. Menschen bestimmt ein Interesse an erweiterten Zeichensätzen.

> Meine Folien von Vorträgen zu dem Thema sollten sich jedoch alle im Netz 
> finden lassen.
Hmmm. Vielleicht tauchen einfach nicht die richtigen Stichworte darin auf...

Bleibt zusammenfassend zu sagen, dass es zwei ganz gute und einfache 
Wege gibt unter Windows wenigstens die gängigen deutschen Sonderzeichen 
auf der Konsole nach MySQL hinein und wieder hinauszubekommen, ohne 
Zeichensalat zu produzieren.
Die schönsten Varianten sind und bleiben natürlich Ein- und Ausgabe 
durchgehend in UTF-8 mit entsprechenden Tools oder mit einer 
UTF-8-fähigen Konsole in einem unixoiden OS.

Mit freundlichen Grüßen

Jürgen Schmitts
Thread
Re: Deutsche Umlaute und UTF8f4ckm528 Mar
  • Re: Deutsche Umlaute und UTF8Susanne Ebrecht30 Mar
    • Re: Deutsche Umlaute und UTF8f4ckm530 Mar
      • Re: Deutsche Umlaute und UTF8Susanne Ebrecht31 Mar
        • Re: Deutsche Umlaute und UTF8f4ckm51 Apr