vendredi 14 décembre 2007

Latin-9 c'est bien, mais pas top encore ...

Latin-9 (de son petit nom ISO-8859-15) ajoute le support (entre autres) le suport du caractère € qui manquait à Latin-1 (ISO-8859-1), et c'est bien.

Cependant Latin-9, et c'est déjà beaucoup moins bien, supprime le support (entre autres) du caractère '¨' (Tréma isolé), et - je l'ai déjà dit, mais - c'est beaucoup moins bien.

Je cite :

Avec ISO-8859-1 : - vous disposez des : ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ­ ®¯ ° ± ² ³ ´ µ ¶·¸ ¹ º» ¼ ½ ¾. (Code décimale de 161 à 162). ...

ISO-8859-15 ou latin9 surnommé latin0 : Il pallie les insuffisances de ISO-8859-1 mais, à mon avis, d'une manière moins élégante. (Note de moi, ça c'est sur) ... Disparaissent aussi et sont remplacés par des caractères finlandais : ¦ (broken bar) ; le tréma isolé : ¨ l'accent aigu : ´ ; la cédille isolée : ¸ ; et le ¾

Et voilà comment on fait vautrer une application en ajoutant le support du sigle '€' ...

Cependant, on pourra noter les choses suivantes :

  • le parseur XML de Java traite lit et enregistre sans erreur ce caractère ('€') même dans un flux XML encodé en Latin-1 ;
  • le parseur MSXML de Microsoft lit correctement ce caractère (même si ça ne ressemble à rien) dans un flux XML encodé en Latin-1
  • le parseur MSXML de Microsoft plante lors de l'enregistrement d'un caractère '€' dans un flux XML encodé en Latin-1. La méthode save() renvoie une COleException dont le libellé est "erreur inconnue" et arrête d'écrire dans le fichier ... (ce qu'il fait d'ailleurs à priori dès qu'un caractère invalide dans l'encodage courant doit être écrit). Et ça, je trouve que c'est mal ; mais peut-être que je me trompe :-|

Vive l'UTF-8 !!! (enfin ... pour le moment)

C'était mon coup de gueule du vendredi ;)