fr.comp.normes.unicode
[Top] [All Lists]

Re: UTF-8

Subject: Re: UTF-8
From: Jean-Marc Desperrier
Date: Mon, 11 Dec 2006 12:20:46 +0100
Newsgroups: fr.comp.normes.unicode
Olivier Miakinen wrote:
Le 10/12/2006 11:32, Pierre Hallet a écrit :
Pour les typographes qui tiennent aux tirets cadratins,
aux espaces fines, etc., les caractères à trois octets
ne sont pas si rares. [...]
C'est surtout un bon choix, à mon humble avis. La perte pour les
typographes occidentaux n'est que d'un octet à chaque signe de
ponctuation générale, signes relativement rares, [...]
Pour moi, c'est surtout un bon choix parceque l'inclusion d'une bonne
partie d'entre eux dans Unicode est une erreur.
Il ne faut pas imposer à l'utilisateur d'entrer autre chose qu'un espace
standard, et c'est au système de composition typographiquement correct
de déterminer selon le contexte quelle variante d'espace est à afficher
(s'il a besoin en interne de manipuler une représentation de la chaîne
après résolution des espace, la bonne méthode est d'utiliser les
caractères réservés pour usage interne, pas de prendre pour cet usage
des caractères utilisables pour les échanges publics).
Pour les tirets, techniqument ce serait probablement aussi faisable
comme cela, mais là on peut vraiment dire qu'ils ont chacun une valeur
sémantique propre et qu'il est normal de les séparer. En allant
cependant jusqu'au bout de l'option valeur sémantique pour les tirets,
il faudrait plutôt un signe qui ne garde que cette valeur sémantique et
dont le glyphe sera différent en fonction de la langue/contexte
culturel. D'ailleurs ça serait beaucoup plus pratique d'utiliser un
système de ce genre pour les guillemets, on peut remarquer que Word
exprime ce problème quand il modifie le caractère unicode associé à la
touche " en fonction de la langue sélectionnée pour le texte.




<Prev in Thread] Current Thread [Next in Thread>