Umstellung auf UTF-8: Der Teufel liegt im Detail

Der Beitrag wurde am 7. April 2008 von Oliver veröffentlicht

Am vergangenen Wochenende habe ich sämtliche Blogs auf UTF-8 aktualisiert. Nach schwersten Problemen mit den Datenbanken und auch einigen verlorenen Daten, die durch ein Plugin verursacht wurden, dachte ich, die Updates wären durch und alles würde endlich korrekt laufen. Die Datenbanken waren umgestellt, in der WordPress-Config lief alles auf UTF-8 und die Umlaute wurden auch im Browser wieder richtig dargestellt. Dem war dann aber doch nicht so. Neue Beiträge, die schon unter der neuen Konfiguration geschrieben wurden, tauchten in den Google-SERPs und in Google News plötzlich mit demselben Umlautsalat auf, wie ich ihn vorher in den Datenbanken hatte. Die Beiträge selbst wurden jedoch im Browser völlig korrekt angezeigt. Auch in der Datenbank und in den Feeds stimmt alles. Ich überprüfte den Header, um zu sehen, ob UTF-8 auch korrekt mitgeschickt wird. Wurde es. Im nächsten Schritt validierte ich die Templates komplett neu, was einige neue Fehler an den Tag brachte.

Grund dafür war, dass die PHP-Dateien des Templates natürlich vorher nicht mit einem UTF-8-fähigen Editor bearbeitet und entsprechend abgespeichert wurden. Nachdem die Fehler auch noch beseitigt waren, änderte sich aber trotzdem nichts an dem Google-Problem. Nach viel Hirnschmalz, Wut und Kaffee kam ich dann endlich auf die Apache2-Config, in der das “AddDefaultCharset” noch per Default auf “ISO-8859-1″ stand. Zunächst versuchte ich “AddDefaultCharset” per .htaccess nur für die einzelnen Webs auf “none”, bzw. “UTF-8″ zu setzen, was auch keine Änderung brachte. Irgendwie wurde die WordPress-Config immer wieder überschrieben von der Apache2-Config überschrieben, auch wenn der Header korrekt ausgeliefert wurde. Erst nachdem ich die Änderung in der Apache2-Config vorgenommen habe und das “AddDefaultCharset” auf “none” setzte, klappte es auch wieder mit Google und die Umlaute wurden korrekt dargestellt.

Wer wirklich auf UTF-8 umstellen möchte, was für die Zukunft dringend anzuraten ist, der sollte folgende Punkte abarbeiten:

- Backups der Datenbanken machen (Tipp: WordPress Database Backup).
- Das Blog in den Wartungsmodus schalten (Tipp: Bueltges Wartungsmodus-Plugin).
- Datenbanken auf UTF-8 umschalten (Mit Plugin oder ohne).
- Umlaute in Beiträgen überprüfen und ggf. mit einem Script oder manuell ersetzen.
- In der wp-config.php das default_charset auf UTF-8 setzen.
- Im WordPress-Admin UTF-8 für Lesen und Feed anwählen.
- Alles umgestellt? Wird alles korrekt angezeigt?
- Dann Template mit dem Validator prüfen.
- Fehler in Templates mit einem UTF-8-fähigen Editor (Notepad++) korrigieren.
- Header überprüfen, ob UTF-8 korrekt mitgeschickt wird.
- Ggf. die Server-, bzw. Apache-Config prüfen (AddDefaultCharset).

Abgelegt in Blogging, Suchmaschinen | Tags: none

8 Kommentare »

RSS-Feed für Kommentare zu diesem Beitrag. TrackBack URI

  1. Gravatar of Uwe

    Kommentar von Uwe vom 8.4.2008

    …dass die PHP-Dateien des Templates natürlich vorher nicht mit einem UTF-8-fähigen Editor bearbeitet und entsprechend abgespeichert wurden.

    Das hat mich auch schon Nerven gekostet und das nicht zu knapp ;-)

  2. Gravatar of coco

    Kommentar von coco vom 10.4.2008

    Echt gute Seite, macht super Spass hier zu lesen. Interessante Artikel, die gut geschrieben sind. Hoffe bald mehr von Euch;-)

  3. Gravatar of Peter von My-Mosaik

    Kommentar von Peter von My-Mosaik vom 10.4.2008

    Die Probleme kenne ich nur zu gut. Tückisch ist auch, es funktioniert alles. Man ist mal an einem anderen Rechner, benutzt dort einen Editor der natürlich nicht UTF-8 kann, und eine Woche später fällt es erst auf. Da hat man diese Änderung aber schon längst vergessen und muss erst mal stundenlang wieder suchen.

  4. Gravatar of Autor

    Kommentar von Autor vom 11.4.2008

    Ja, Zeichensätze waren auch bei mir bereits mehr als einmal Ursache für größere Unmutsäußerungen (vorsichtig ausgedrückt ;) )

  5. Gravatar of Marco

    Kommentar von Marco vom 15.4.2008

    Ich habe auch ab und zu mal Probleme mit den Umlauten gehabt und das Ganze kann einem wirklich auf die Nerven gehen, wenn man den Fehler ohne Ende sucht.

  6. Gravatar of basti

    Kommentar von basti vom 23.4.2009

    hallo, du schreibst: “Wer wirklich auf UTF-8 umstellen möchte, was für die Zukunft dringend anzuraten ist [...]“. meine frage: warum? warum ist es anzuraten auf utf-8 umzustellen?

  7. Gravatar of [WordPress] Immer wieder Probleme mit den Umlauten » WordPress, Problem, Workaround, Update, Artikel, Doch » Nils Schulte am Hülse

    Pingback von [WordPress] Immer wieder Probleme mit den Umlauten » WordPress, Problem, Workaround, Update, Artikel, Doch » Nils Schulte am Hülse vom 7.9.2009

    [...] beheben: Nie wieder Umlaut-Chaos – Workshop gegen das Chaos‘ und ‘Umstellung auf UTF-8: Der Teufel liegt im Detail‘. In dem ersteren fand ich einen Hinweis auf ein Tool mit dem sich bei bestimmten [...]

  8. Gravatar of Kerber

    Kommentar von Kerber vom 10.11.2010

    Oh gott hatte neulich erst auch damit zutun XD schrecklich.

    Vor allem Dreamweaver macht immer wieder Probleme mit UTF-8

Einen Kommentar schreiben

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Powered by WordPress - Valid XHTML and CSS. ^Top^