fr.comp.normes.unicode
[Top] [All Lists]

Re: Plage des Mots qui ont un seul caractÃre ?

Subject: Re: Plage des Mots qui ont un seul caractÃre ?
From: Xavier Roche
Date: Tue, 19 Feb 2008 16:42:03 +0100
Newsgroups: fr.comp.normes.unicode

Jean-Philippe Odent wrote:
  De mÃme que les caractÃres Ascii (8 bits) sont localisÃs dans la
zone de 0 Ã 127, je cherche la zone des unicodes japonais qui forment
un mot en un seul caractÃre. Je parle donc pas des syllables mais bien
des mots d'une seul caractÃre.
Euh, vous pouvez Ãventuellement sÃparer les katakana, mais pour les
Kanji (idÃogrammes), il est totalement impossible de sÃparer les mots
composÃs (de kanjis et/ou de kanas) des kanjis "isolÃs" puisque ce sont
les mÃme caractÃres (au sens Unicode du terme) sans appliquer des
traitements (trÃs) complexes.
(Pour prendre un exemple, le "ç" de "ç"(ã) (blanc) et le "ç" de "ç
ç" (riz blanc) ou de "éç" ("amusant") sont identiques)




<Prev in Thread] Current Thread [Next in Thread>