Поздравления - >74@02;5=8O News Bug

Ebenso in der Forum-Box auf der Startseite. (vgl Anhang mit eigentlichem Thread-Titel)
 

Anhänge

  • Bild 2.png
    Bild 2.png
    26,1 KB · Aufrufe: 73
Das is nur die Erklärung, nicht aber die Lösung :p

Die Lösung is:
  • entweder UTF-8 einsetzen
  • oder sich eben die Mühe machen und alle Non-ISO-8859-1-Zeichen auf ihre Entitäten umzurechnen. Immerhin kannst du auch mit ISO-8859-1 Kyrillisch darstellen.
edit:
Das Forum is ja das beste Beispiel. Es gibt auch nur ISO-8859-1 aus, aber hier geht alles ;)
 
Zuletzt bearbeitet:
Schon ...

Aber der eigentliche "Bug" ist, dass die News normalerweise in ISO bestellt sind und auch als ISO geliefert werden. Wenn dann zwischendrin ne UTF-8 News ist, nur weil die besondere Zeichen enthält ist das natürlich doof. Muss ich zunächst nen utf-8-Erkenner drüberlaufen lassen. :yawn:

Meine News-Einliefer-Korrigier-Bots sind größer als der restliche Code von klamm zusammen. Wenn man das Quell-HTML der News-Einlieferungen sieht, wird einem regelmäßig schlecht. :ugly:
 
Aber der eigentliche "Bug" ist, dass die News normalerweise in ISO bestellt sind und auch als ISO geliefert werden. Wenn dann zwischendrin ne UTF-8 News ist, nur weil die besondere Zeichen enthält ist das natürlich doof.
Klingt nach einer Möglichkeit, n Preisnachlass rauszuhandeln ;) Immer zahlst du ja dafür 8O
 
Jetzt tut sich aber die Frage auf:

Da in Headlines nun HTML "erlaubt" ist (wegen der notwendigen UTF8-Entities) ... wie baue ich meinen String-Kürzer um? Der darf ja die Entities nicht breaken. Bisher hab ich immer un_htmlfentities() gemacht, gekürzt und wieder htmlentities(). Das geht jetzt nicht mehr, da es ja keine passenden ISO-Zeichen für die UTF8-Entities gibt. un_htmlentities() produziert dann die hier gemeldeten Krüppelzeichen. :ugly:

Edit: Ok gibt genug Snippets dafür. ;)
 
Wenn du jetzt auch noch die Startseiten-Forum-Box hinbekommst, ist alle super. Und das kann ja nicht an der News liegen, sondern an der Kommunikation zwischen Forum und Startseite.
 
Nun sind aber in der Newsübersicht einige Fehler drin :-?
 

Anhänge

  • newsbug.jpg
    newsbug.jpg
    69,7 KB · Aufrufe: 86
Das kommt daher, wenn der Lieferant doppelt und 3-fach htmlentities() macht beim Liefern... fix ich gleich. Edit: fixed. Falls nochwas auffällt bitte melden.
 
Kann man das nicht gaaanz normal in einem CDATA-Block in einem XML-File liefern? Was für komische Lieferanten hast du?
 
Selbst die größten Agenturen liefern das kackig. Die Reporter haben halt von HTML/XML keine Ahnung. Die bauen das in TYPO3 oder so und exportieren das dann krüpplig und am Ende darfst Du selbst das Encoding rausfinden und wie oft da Entities drübergejagt wurden. Von so Sachen wie "wir machen einen Absatz mit ..."
PHP:
       
       
       
       
       
      
ganz zu schweigen. :ugly:
 
Und dafür zahlst du?
rofl.gif


So Kinderkacke wie 41 (geschützte) Leerzeichen für einen Zeilenumbruch erwarte ich von ner Hausfrau, die den Computer zum Spielen und Chatten nutzt und einmal n Kündigungsschreiben mit ihrem M:money: Word verfassen musste :ugly: ... aber nicht von einem Nachrichten-Lieferanten, der 3stellige Kohle im Monat von dir kriegt.

Ich hab nur einmal so ne Spezifikation gesehen, wie News ausgeliefert werden und das war n 80-Seiten-PDF, was nur den Börsenticker erklärt hatte.
 
Geil is natürlich jetzt, wenn die -eigentlich- ohne Entities liefern, aber ich dann UTF8-Entitie-Zeichen reinbauen muss, damit das unter ISO dargestellt werden kann. Dann hab ich einen Mischmasch ... könnte Probleme geben, wenn der nicht-entitisierte Rest dann Zeichen wie < enthält und ich das z.B. ungesehen als Title-Tag verwende. :-?
 
Bei solchen Mischmasch einige ich mich intern auf eine Darstellungsform (UTF-8 bietet sich immer an, weil es schön "einfach" is) und wandle bei der Ausgabe eben entsprechend um.

Guck halt mal, wie das Forum das handhabt. Das hat sicher auch ne UTF-8-Verbindung zur Datenbank.
 
Naja, die Absätze könnte man in mehreren Child-Elementen liefern die man dann nacheinander durchgeht..

Bold kann man in ForenCode umwandeln, das wär cool.. und die Bildchen liefert man als Platzhalter.. und dann einfach die Url dazu.. und die Eigenschaften des Bildes in einem weiteren Parameter - aber scheinbar sind die nicht so modern.. :ugly:
 
Wunschträume. ;)

Naja, meine Korrektur-Bots sind innerhalb von 10 Jahren recht mächtig geworden. Ich muss nur alle paar Wochen drüberschaun und ggf. neue HTML-Leichtsinnsfehler von neuen Redakteuren korrigieren.

Das hier jetzt mit UTF8 :arrow: ISO Support war eher ein grundsätzliches Problem, was jetzt behoben ist. Bisher ging ich davon aus, dass die Headlines keine Entities enthalten ... jetzt dürfen sie das und damit ist fast alles darstellbar.