fr.comp.normes.unicode
[Top] [All Lists]

Re: UTF-8

Subject: Re: UTF-8
From: Xavier Roche
Date: Sat, 09 Dec 2006 09:50:04 +0100
Newsgroups: fr.comp.normes.unicode
Denis Liégeois a écrit :
Par ailleurs, pour que ça nécessite trois octets, il faut
vraiment aller chercher de l'exotique. Non seulement ça
n'arriverait jamais avec des langues comme le français,
l'anglais, l'espagnol, l'allemand etc., mais ça n'arriverait
même pas avec les langues slaves, ni même avec le grec,
y compris le grec ancien.
Pas plus pour l'arabe, l'hébreu, ou le syriac. Il faut vraiment aller du
côté du telugu ou du thai pour attaquer les exotismes.
Table 3.1B. Legal UTF-8 Byte Sequences
<http://www.unicode.org/reports/tr28/tr28-3.html>

The Unicode Character Code Charts By Script
<http://www.unicode.org/charts/>

Et vu la proportion d'accents dans un texte français, avoir un ou deux octets ne fait au final aucune différence (d'autant que les en-têtes font bien souvent plus de la moitié du poids de l'article sur Usenet..)

<Prev in Thread] Current Thread [Next in Thread>