Umlaute: UTF-8 Fehlanzeige

kazUka · 18. April 2009, 02:26

Hallo,

Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;", habe ich mich entschlossen, mal das hier zu posten. In meinen Scripten werden diese Umlaute nie angezeigt. Auch wenn ich utf-8 oben "einbinde". Da ich schon meinen Freund Google benutz habe, hatte ich eine Lösung gefunden. Manche Editoren speichern die Files nicht in der utf-8 Kodierung ab, daher einen anderen Editor wie Notepad++ benutzen. Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen? Gibt es da nicht andere Wege?

Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

Ich wäre über antworten sehr dankbar!

Gruß

Snowflake · 18. April 2009, 02:47

Hey. Woher kommen deine Texte wo die Umlaute falsch dargestellt werden?
Sind sie in deiner Seite per hand geschrieben oder kommen sie aus einer Datenbank?

vince · 18. April 2009, 08:17

Hi,

kazUka schrieb:

Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen?

Nein, nein. Du musst lediglich die HTML Entinitäten einsetzen.
Hier stehen alle: de.selfhtml.org/html/referenz/zeichen.htm
z.B "Der Bär" => "Der Bär"

kazUka schrieb:

Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

Jein. In unserem Raum haben wir die ISO-8859-1 bzw ISO-8859-15 womit sich alle gängigen Zeichen problemlos darstellen lassen.

Wenn jetzt aber eine Person, welche den Zeichensatz UTF-8 in seienm Browser eingestellt hat und nicht die besagten ISO´s besitzt, auf deine Seite kommt, dann gibts Codemüll.
Da ist der Vorteil von Unicode-UTF8.Denn UTF8 strebt an, jedes mögliche Zeichen darzustellen. Es sollten über 1Mio. Zeichen sein, die afaik unterstützt werden.
Jeder Browser unterstützt nur eine gewisse ANzahl von Zeichensätzen, wobei UTF8 immer dabei sein sollte.

Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;",

Der charset sorgt nicht dafür, dass deine Umlaute umgewandelt werden, sondern ist eine "Hilfe" für den Browser, dass er weiss welchen Zeichensatz er benutzen soll.

Du kannst ja mal ein bischen rumspielen.
Wenn du Firefox benutzt findest du unter "Ansicht" => "Zeichenkodierung" die verfügbaren Zeichensätze, wo du das on-the-fly umstellen kannst.

//edit
Wenn du PHP im Einsatz hast, gibts einen schönen Wikartikel von d0nut
[wiki]UTF-8 Kodierung sicherstellen[/wiki]

BennyBunny · 18. April 2009, 10:02

Ich wollt nochmal nen Wort zu den Enitäten verlieren: Es ist ja grad der Sinn, dass man die Zeichen an sich benutzt, wenn man ne ander Encodierung bentutz. Deswegen krieg ich auch immer halb die Krise, wenn ich UTF-8 Seiten mit Enitäten sehe - Zumindest für die Umlaute.

In der Regel liegt es bei Darstellungsproblemem an folgenden Punkten:

Die Datei ist nicht als UTF-8 kodiert. Notepad++ oder so hilft da weiter.
Der Werbserver liefert das Dokument mit falschen Encoding aus.
Bei Datenbank Transaktionen mit mySQL wurde beim Aufbauen der Verbindung kein set charcterset mitgeliefert.

kazUka · 18. April 2009, 10:51

Erstmal danke an alle.

@Snowflake
Sie sind per Hand geschrieben.

@vince
Ich kenne die Entities..aber das soll ja der Vorteil von UTF-8 zum Beispiel sein. Das wenn man in den Editor ü tippt, das es am Ende auch ü anzeigt..und nicht das ich immer das umbrechen muss. Sowas unterstützen auch nicht alle Web Editoren, leider. Und eine Arbeit ist es leider auch.
Vielen Danke für die Aufklärung!

@BennyBunny
Das mit UTF-8 und den umbrechen, da ich ich der gleichen Meinung.

Okay villt muss ich mir doch Notepad++ runterladen und das dann kodieren..

Danke wirklich, wenn jemand noch etwas weiß, dann bitte posten.

Edit:
Hab das Problem gelöst, indem ich in meinem Editor "Encoding -> UTF-8" gewählt habe..endlich habe ich es gefunden..danke an alle.

Gruß,
kazUka

Rondrer · 18. April 2009, 11:19

ok, wollte gerade schreiben, dass das die allermeisten Editoren können sollten auf ein anderes Encoding umzuschalten

(solange man nicht mit Notepad programmiert)

vince · 18. April 2009, 14:20

Die Entitys scheinen nicht so beliebt zu sein :huh:

Ich hab noch nie speziell drüber nachgedacht, aber wo ist das Problem dabei ?
Best Case ist alles auf UTF8 zu kodieren, aber warum kriegst du eine Krise wenn du sdas siehst BennyBunni

Torben Brodt · 18. April 2009, 18:09

vince schrieb:

Ich hab noch nie speziell drüber nachgedacht, aber wo ist das Problem dabei ?

unnötiger Zeichenverbrauch

Außerdem hilft das nur bei der Darstellung. Das Übel beginnt aber schon bei der Datenverarbeitung.

Wir (Arbeitgeber plista) speichern Daten von verschieden kodierten Webseiten und stellen es auf verschieden kodierten Webseiten wieder da.
Wir haben da vor kurzem ein Techtalk zum Thema Unicode gehabt und unser Betriebssystemexperte hat die ganzen Daten mal auseinandergenommen.

Schaut euch mal folgenden Artikel an: [wiki]Unicode und PHP <= 5[/wiki]

Verfolgt man mal die Abläufe vom Editor zur Bash, von der Bash zum Terminal, vom Terminal in den Webserver, vom Webserver zum PHP Prozess, der PHP Prozess liest die Datei die einen Zeichensatz aufweist, der Code verbindet sich dann über das Connection Encoding zum MySQL Prozess, davon zur MySQL Datenbank, von der MySQL Datenbank zur Tabelle und von der Tabelle zu den Spalten so möchte man kaum wahr haben, dass jeder dieser Schritte ein eigenes Encoding verwendet kann.

Die Welt wäre besser, wenn jeder ausschließlich UTF-8 nutzen würde

Umlaute: UTF-8 Fehlanzeige

Umlaute: UTF-8 Fehlanzeige

kazUka schrieb:

kazUka schrieb:

vince schrieb:

Teilen

Tags