fr.comp.normes.unicode
[Top] [All Lists]

Re: codage de sortie de la bdd (problème de débutant avec utf-8)

Subject: Re: codage de sortie de la bdd problème de débutant avec utf-8
From: Vincent Ramos
Date: Thu, 02 Feb 2006 11:01:43 +0100
Newsgroups: fr.comp.normes.unicode
D. Eissart a écrit :

> Mais réellement je ne comprends rien au fonctionnement de cet
> encodage... (Et je pense que vu la façon dont ça se passe utf-8 n'est
> pas mûr pour devenir "la" référence absolue, ou alors il va falloir
> créer des outils "grand-public" qui ne soient pas des "prises de tête"
> permanentes...)

Si si, cela fonctionne très bien : la preuve est que vos <œ> non pas mal
codés mais codés selon Windows ont été très correctement transformés par
l'algorithme UTF-8. Le problème, c'est que le résultat n'est pas celui que
vous attendiez. Du reste, tout mon système (GNU/Linux Gentoo) tourne en
UTF-8 et je n'ai aucun souci de ce côté-là.
 
> Petite question subsidiaire;
> Pourquoi ma façon de procéder ne fonctionne pas?
 
> - je copie mes textes (1ère version du site) directement sur l'écran du
> navigateur après sélection avec la souris.
> - je les colle dans SciTE (éditeur de texte dans lequel j'ai mis en
> ligne 1 "coding: utf-8" et dans lequel je vérifie bien que le codage est
> bien indiqué utf-8.
> - je recopie ces textes dans SciTE et je les colle dans la base de
> données où tous les paramètres modifiables ont été mis à la valeur
> utf-8. (*)

Si le texte contient des <o> codés à la Windows, votre transformation en
UTF-8 les conserve ainsi, ce qui les rend illisibles. Il vous faut une
étape supplémentaire : 

* copiez tous vos textes dans votre éditeur ; 
* passez-les d'abord en latin-9 (ISO 8859-15). Cela vous débarrassera des
<œ> Windowsiens tout en les remplaçant par leur contrepartie ISO (norme
internationale) ;
* passez le texte en UTF-8.

De cette manière, tout devrait être bien recodé.
  
> Enfin, je suis preneur d'adresses de sites où je pourrais essayer de
> comprendre cette peu appétissante soupe alchimique ....

<http://www.cl.cam.ac.uk/~mgk25/unicode.html>

<Prev in Thread] Current Thread [Next in Thread>