Adult Webmaster Blog
Blog von AWM-Resource - Themen wie SEO, Payment, Content, Programmierung, Jugendschutz und Marketing
Umstellung auf UTF-8: Der Teufel liegt im Detail
Der Beitrag wurde am 7. April 2008 von Oliver veröffentlichtAm vergangenen Wochenende habe ich sämtliche Blogs auf UTF-8 aktualisiert. Nach schwersten Problemen mit den Datenbanken und auch einigen verlorenen Daten, die durch ein Plugin verursacht wurden, dachte ich, die Updates wären durch und alles würde endlich korrekt laufen. Die Datenbanken waren umgestellt, in der Wordpress-Config lief alles auf UTF-8 und die Umlaute wurden auch im Browser wieder richtig dargestellt. Dem war dann aber doch nicht so. Neue Beiträge, die schon unter der neuen Konfiguration geschrieben wurden, tauchten in den Google-SERPs und in Google News plötzlich mit demselben Umlautsalat auf, wie ich ihn vorher in den Datenbanken hatte. Die Beiträge selbst wurden jedoch im Browser völlig korrekt angezeigt. Auch in der Datenbank und in den Feeds stimmt alles. Ich überprüfte den Header, um zu sehen, ob UTF-8 auch korrekt mitgeschickt wird. Wurde es. Im nächsten Schritt validierte ich die Templates komplett neu, was einige neue Fehler an den Tag brachte.
Grund dafür war, dass die PHP-Dateien des Templates natürlich vorher nicht mit einem UTF-8-fähigen Editor bearbeitet und entsprechend abgespeichert wurden. Nachdem die Fehler auch noch beseitigt waren, änderte sich aber trotzdem nichts an dem Google-Problem. Nach viel Hirnschmalz, Wut und Kaffee kam ich dann endlich auf die Apache2-Config, in der das “AddDefaultCharset” noch per Default auf “ISO-8859-1″ stand. Zunächst versuchte ich “AddDefaultCharset” per .htaccess nur für die einzelnen Webs auf “none”, bzw. “UTF-8″ zu setzen, was auch keine Änderung brachte. Irgendwie wurde die Wordpress-Config immer wieder überschrieben von der Apache2-Config überschrieben, auch wenn der Header korrekt ausgeliefert wurde. Erst nachdem ich die Änderung in der Apache2-Config vorgenommen habe und das “AddDefaultCharset” auf “none” setzte, klappte es auch wieder mit Google und die Umlaute wurden korrekt dargestellt.
Wer wirklich auf UTF-8 umstellen möchte, was für die Zukunft dringend anzuraten ist, der sollte folgende Punkte abarbeiten:
- Backups der Datenbanken machen (Tipp: Wordpress Database Backup).
- Das Blog in den Wartungsmodus schalten (Tipp: Bueltges Wartungsmodus-Plugin).
- Datenbanken auf UTF-8 umschalten (Mit Plugin oder ohne).
- Umlaute in Beiträgen überprüfen und ggf. mit einem Script oder manuell ersetzen.
- In der wp-config.php das default_charset auf UTF-8 setzen.
- Im Wordpress-Admin UTF-8 für Lesen und Feed anwählen.
- Alles umgestellt? Wird alles korrekt angezeigt?
- Dann Template mit dem Validator prüfen.
- Fehler in Templates mit einem UTF-8-fähigen Editor (Notepad++) korrigieren.
- Header überprüfen, ob UTF-8 korrekt mitgeschickt wird.
- Ggf. die Server-, bzw. Apache-Config prüfen (AddDefaultCharset).
Soziales: del.icio.us | Mister Wong | yigg.de | digg.com
Verwandte Themen:
7 Kommentare »
RSS-Feed für Kommentare zu diesem Beitrag. TrackBack URI





Kommentar von Uwe vom 8.4.2008
Das hat mich auch schon Nerven gekostet und das nicht zu knapp ;-)
Kommentar von coco vom 10.4.2008
Echt gute Seite, macht super Spass hier zu lesen. Interessante Artikel, die gut geschrieben sind. Hoffe bald mehr von Euch;-)
Kommentar von Peter von My-Mosaik vom 10.4.2008
Die Probleme kenne ich nur zu gut. Tückisch ist auch, es funktioniert alles. Man ist mal an einem anderen Rechner, benutzt dort einen Editor der natürlich nicht UTF-8 kann, und eine Woche später fällt es erst auf. Da hat man diese Änderung aber schon längst vergessen und muss erst mal stundenlang wieder suchen.
Kommentar von Autor vom 11.4.2008
Ja, Zeichensätze waren auch bei mir bereits mehr als einmal Ursache für größere Unmutsäußerungen (vorsichtig ausgedrückt ;) )
Kommentar von Marco vom 15.4.2008
Ich habe auch ab und zu mal Probleme mit den Umlauten gehabt und das Ganze kann einem wirklich auf die Nerven gehen, wenn man den Fehler ohne Ende sucht.
Kommentar von basti vom 23.4.2009
hallo, du schreibst: “Wer wirklich auf UTF-8 umstellen möchte, was für die Zukunft dringend anzuraten ist [...]“. meine frage: warum? warum ist es anzuraten auf utf-8 umzustellen?
Pingback von [WordPress] Immer wieder Probleme mit den Umlauten » WordPress, Problem, Workaround, Update, Artikel, Doch » Nils Schulte am Hülse vom 7.9.2009
[...] beheben: Nie wieder Umlaut-Chaos – Workshop gegen das Chaos‘ und ‘Umstellung auf UTF-8: Der Teufel liegt im Detail‘. In dem ersteren fand ich einen Hinweis auf ein Tool mit dem sich bei bestimmten [...]