Umlaute: UTF-8 Fehlanzeige

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • Umlaute: UTF-8 Fehlanzeige

    Hallo,

    Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;", habe ich mich entschlossen, mal das hier zu posten. In meinen Scripten werden diese Umlaute nie angezeigt. Auch wenn ich utf-8 oben "einbinde". Da ich schon meinen Freund Google benutz habe, hatte ich eine Lösung gefunden. Manche Editoren speichern die Files nicht in der utf-8 Kodierung ab, daher einen anderen Editor wie Notepad++ benutzen. Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen? Gibt es da nicht andere Wege?

    Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

    Ich wäre über antworten sehr dankbar!

    Gruß
  • Hi,


    kazUka schrieb:

    Aber muss ich wirklich einen anderen Editor, nur wegen der utf-8 benutzen?

    Nein, nein. Du musst lediglich die HTML Entinitäten einsetzen.
    Hier stehen alle: de.selfhtml.org/html/referenz/zeichen.htm
    z.B "Der Bär" => "Der Bär"

    kazUka schrieb:

    Ich habe mal iso benutzt und da hat es wunderbar geklappt. Nur sehe ich heutzutage nur noch utf-8, da es ja die neue "standratisierung" sein soll.

    Jein. In unserem Raum haben wir die ISO-8859-1 bzw ISO-8859-15 womit sich alle gängigen Zeichen problemlos darstellen lassen.

    Wenn jetzt aber eine Person, welche den Zeichensatz UTF-8 in seienm Browser eingestellt hat und nicht die besagten ISO´s besitzt, auf deine Seite kommt, dann gibts Codemüll.
    Da ist der Vorteil von Unicode-UTF8.Denn UTF8 strebt an, jedes mögliche Zeichen darzustellen. Es sollten über 1Mio. Zeichen sein, die afaik unterstützt werden.
    Jeder Browser unterstützt nur eine gewisse ANzahl von Zeichensätzen, wobei UTF8 immer dabei sein sollte.

    Da ich bisher sehr oft Schwierigkeiten mit den Umlauten habe, trotz des "charset=utf-8;",

    Der charset sorgt nicht dafür, dass deine Umlaute umgewandelt werden, sondern ist eine "Hilfe" für den Browser, dass er weiss welchen Zeichensatz er benutzen soll.



    Du kannst ja mal ein bischen rumspielen.
    Wenn du Firefox benutzt findest du unter "Ansicht" => "Zeichenkodierung" die verfügbaren Zeichensätze, wo du das on-the-fly umstellen kannst.


    //edit
    Wenn du PHP im Einsatz hast, gibts einen schönen Wikartikel von d0nut
    [wiki]UTF-8 Kodierung sicherstellen[/wiki]
  • Ich wollt nochmal nen Wort zu den Enitäten verlieren: Es ist ja grad der Sinn, dass man die Zeichen an sich benutzt, wenn man ne ander Encodierung bentutz. Deswegen krieg ich auch immer halb die Krise, wenn ich UTF-8 Seiten mit Enitäten sehe - Zumindest für die Umlaute.

    In der Regel liegt es bei Darstellungsproblemem an folgenden Punkten:

    Die Datei ist nicht als UTF-8 kodiert. Notepad++ oder so hilft da weiter.
    Der Werbserver liefert das Dokument mit falschen Encoding aus.
    Bei Datenbank Transaktionen mit mySQL wurde beim Aufbauen der Verbindung kein set charcterset mitgeliefert.
  • Erstmal danke an alle.

    @Snowflake
    Sie sind per Hand geschrieben.

    @vince
    Ich kenne die Entities..aber das soll ja der Vorteil von UTF-8 zum Beispiel sein. Das wenn man in den Editor ü tippt, das es am Ende auch ü anzeigt..und nicht das ich immer das umbrechen muss. Sowas unterstützen auch nicht alle Web Editoren, leider. Und eine Arbeit ist es leider auch.
    Vielen Danke für die Aufklärung!

    @BennyBunny
    Das mit UTF-8 und den umbrechen, da ich ich der gleichen Meinung.

    Okay villt muss ich mir doch Notepad++ runterladen und das dann kodieren..

    Danke wirklich, wenn jemand noch etwas weiß, dann bitte posten.


    Edit:
    Hab das Problem gelöst, indem ich in meinem Editor "Encoding -> UTF-8" gewählt habe..endlich habe ich es gefunden..danke an alle.


    Gruß,
    kazUka

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von kazUka ()

  • vince schrieb:

    Ich hab noch nie speziell drüber nachgedacht, aber wo ist das Problem dabei ?

    unnötiger Zeichenverbrauch ;) Außerdem hilft das nur bei der Darstellung. Das Übel beginnt aber schon bei der Datenverarbeitung.

    Wir (Arbeitgeber plista) speichern Daten von verschieden kodierten Webseiten und stellen es auf verschieden kodierten Webseiten wieder da.
    Wir haben da vor kurzem ein Techtalk zum Thema Unicode gehabt und unser Betriebssystemexperte hat die ganzen Daten mal auseinandergenommen.

    Schaut euch mal folgenden Artikel an: [wiki]Unicode und PHP <= 5[/wiki]
    Verfolgt man mal die Abläufe vom Editor zur Bash, von der Bash zum Terminal, vom Terminal in den Webserver, vom Webserver zum PHP Prozess, der PHP Prozess liest die Datei die einen Zeichensatz aufweist, der Code verbindet sich dann über das Connection Encoding zum MySQL Prozess, davon zur MySQL Datenbank, von der MySQL Datenbank zur Tabelle und von der Tabelle zu den Spalten so möchte man kaum wahr haben, dass jeder dieser Schritte ein eigenes Encoding verwendet kann.


    Die Welt wäre besser, wenn jeder ausschließlich UTF-8 nutzen würde ;)