fr.comp.normes.unicode
[Top] [All Lists]

Re: table unicode

Subject: Re: table unicode
From: Olivier Miakinen
Date: Tue, 15 Nov 2005 23:40:54 +0100
Newsgroups: fr.comp.normes.unicode
Le 15/11/2005 22:51, Thomas a écrit :
> 
> j'allais dire : c'etait peut etre une table utf-8 plutot qu'unicode,
> mais les codes &xnn; c'est le numero unicode pas utf-8, c'est ca ?

Les numéros Unicode s'écrivent plutôt U+nnnn mais il y a de cela.

UTF-8, c'est un codage possible d'Unicode sur un nombre variable
d'octets. Par exemple, l'€ (U+20AC) se code E2 82 AC en UTF-8. Mais
un navigateur qui supporte les entités numériques hexadécimales
comprendra la syntaxe € tandis que l'entité numérique décimale
€ est comprise par à peu près tous les navigateurs.

> (au fait, unicode = utf-16 ?)

Presque. Les deux versions d'UTF-16 (little endian ou big endian) sont
d'autres codages possibles d'Unicode sur un nombre en général fixe
d'octets, à savoir 2 octets par caractère Unicode (je simplifie un
tout petit peu). Il se trouve que pour les caractères qui se codent
effectivement sur deux octets, la conversion est tellement triviale
qu'on a l'impression que c'est la même chose. Pour l'€ (U+20AC), le
codage est soit 20 AC, soit AC 20, selon qu'il s'agit de la version
big endian ou little endian.

Pour les conversions, voici un outil extraordinaire de simplicité :
<http://people.w3.org/rishida/scripts/uniview.fr/conversion.html>.

-- 
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles.  (3 c.)

<Prev in Thread] Current Thread [Next in Thread>