You are not logged in.

  • Login

1

Saturday, April 18th 2009, 2:26am

Umlaute: UTF-8 Fehlanzeige

Hallo,

Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;", habe ich mich entschlossen, mal das hier zu posten. In meinen Scripten werden diese Umlaute nie angezeigt. Auch wenn ich utf-8 oben "einbinde". Da ich schon meinen Freund Google benutz habe, hatte ich eine Lösung gefunden. Manche Editoren speichern die Files nicht in der utf-8 Kodierung ab, daher einen anderen Editor wie Notepad++ benutzen. Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen? Gibt es da nicht andere Wege?

Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

Ich wäre über antworten sehr dankbar!

Gruß

2

Saturday, April 18th 2009, 2:47am

Hey. Woher kommen deine Texte wo die Umlaute falsch dargestellt werden?
Sind sie in deiner Seite per hand geschrieben oder kommen sie aus einer Datenbank?

3

Saturday, April 18th 2009, 8:17am

Hi,


Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen?

Nein, nein. Du musst lediglich die HTML Entinitäten einsetzen.
Hier stehen alle: http://de.selfhtml.org/html/referenz/zeichen.htm
z.B "Der Bär" => "Der Bär"

Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

Jein. In unserem Raum haben wir die ISO-8859-1 bzw ISO-8859-15 womit sich alle gängigen Zeichen problemlos darstellen lassen.

Wenn jetzt aber eine Person, welche den Zeichensatz UTF-8 in seienm Browser eingestellt hat und nicht die besagten ISO´s besitzt, auf deine Seite kommt, dann gibts Codemüll.
Da ist der Vorteil von Unicode-UTF8.Denn UTF8 strebt an, jedes mögliche Zeichen darzustellen. Es sollten über 1Mio. Zeichen sein, die afaik unterstützt werden.
Jeder Browser unterstützt nur eine gewisse ANzahl von Zeichensätzen, wobei UTF8 immer dabei sein sollte.

Quoted

Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;",

Der charset sorgt nicht dafür, dass deine Umlaute umgewandelt werden, sondern ist eine "Hilfe" für den Browser, dass er weiss welchen Zeichensatz er benutzen soll.



Du kannst ja mal ein bischen rumspielen.
Wenn du Firefox benutzt findest du unter "Ansicht" => "Zeichenkodierung" die verfügbaren Zeichensätze, wo du das on-the-fly umstellen kannst.


//edit
Wenn du PHP im Einsatz hast, gibts einen schönen Wikartikel von d0nut
UTF-8 Kodierung sicherstellen

4

Saturday, April 18th 2009, 10:02am

Ich wollt nochmal nen Wort zu den Enitäten verlieren: Es ist ja grad der Sinn, dass man die Zeichen an sich benutzt, wenn man ne ander Encodierung bentutz. Deswegen krieg ich auch immer halb die Krise, wenn ich UTF-8 Seiten mit Enitäten sehe - Zumindest für die Umlaute.

In der Regel liegt es bei Darstellungsproblemem an folgenden Punkten:

Die Datei ist nicht als UTF-8 kodiert. Notepad++ oder so hilft da weiter.
Der Werbserver liefert das Dokument mit falschen Encoding aus.
Bei Datenbank Transaktionen mit mySQL wurde beim Aufbauen der Verbindung kein set charcterset mitgeliefert.

5

Saturday, April 18th 2009, 10:51am

Erstmal danke an alle.

@Snowflake
Sie sind per Hand geschrieben.

@vince
Ich kenne die Entities..aber das soll ja der Vorteil von UTF-8 zum Beispiel sein. Das wenn man in den Editor ü tippt, das es am Ende auch ü anzeigt..und nicht das ich immer das umbrechen muss. Sowas unterstützen auch nicht alle Web Editoren, leider. Und eine Arbeit ist es leider auch.
Vielen Danke für die Aufklärung!

@BennyBunny
Das mit UTF-8 und den umbrechen, da ich ich der gleichen Meinung.

Okay villt muss ich mir doch Notepad++ runterladen und das dann kodieren..

Danke wirklich, wenn jemand noch etwas weiß, dann bitte posten.


Edit:
Hab das Problem gelöst, indem ich in meinem Editor "Encoding -> UTF-8" gewählt habe..endlich habe ich es gefunden..danke an alle.


Gruß,
kazUka

This post has been edited 1 times, last edit by "kazUka" (Apr 18th 2009, 10:59am)


6

Saturday, April 18th 2009, 11:19am

ok, wollte gerade schreiben, dass das die allermeisten Editoren können sollten auf ein anderes Encoding umzuschalten ;) (solange man nicht mit Notepad programmiert)

7

Saturday, April 18th 2009, 2:20pm

Die Entitys scheinen nicht so beliebt zu sein :huh:

Ich hab noch nie speziell drüber nachgedacht, aber wo ist das Problem dabei ?
Best Case ist alles auf UTF8 zu kodieren, aber warum kriegst du eine Krise wenn du sdas siehst BennyBunni :)

8

Saturday, April 18th 2009, 6:09pm

Ich hab noch nie speziell drüber nachgedacht, aber wo ist das Problem dabei ?

unnötiger Zeichenverbrauch ;) Außerdem hilft das nur bei der Darstellung. Das Übel beginnt aber schon bei der Datenverarbeitung.

Wir (Arbeitgeber plista) speichern Daten von verschieden kodierten Webseiten und stellen es auf verschieden kodierten Webseiten wieder da.
Wir haben da vor kurzem ein Techtalk zum Thema Unicode gehabt und unser Betriebssystemexperte hat die ganzen Daten mal auseinandergenommen.

Schaut euch mal folgenden Artikel an: Unicode und PHP <= 5

Quoted

Verfolgt man mal die Abläufe vom Editor zur Bash, von der Bash zum Terminal, vom Terminal in den Webserver, vom Webserver zum PHP Prozess, der PHP Prozess liest die Datei die einen Zeichensatz aufweist, der Code verbindet sich dann über das Connection Encoding zum MySQL Prozess, davon zur MySQL Datenbank, von der MySQL Datenbank zur Tabelle und von der Tabelle zu den Spalten so möchte man kaum wahr haben, dass jeder dieser Schritte ein eigenes Encoding verwendet kann.


Die Welt wäre besser, wenn jeder ausschließlich UTF-8 nutzen würde ;)

Similar threads

Social bookmarks