fr.comp.normes.unicode
[Top] [All Lists]

Re: hindi

Subject: Re: hindi
From: "Antoine Leca"
Date: Mon, 23 Jan 2006 11:04:39 +0100
Newsgroups: fr.comp.normes.unicode
In news:[email protected], Jean-Marc Desperrier va escriure:
> nurka7 wrote:
>> Est-ce qu'il y a un moyen de convertir le texte de Word en un format
>> "légitime" pour que je puisse le copier?
>
> Je pense qu'il doit y avoir moyen de trouver par quel caractères ASCII
> est représenté chaque caractère hindi

« Séquences de caractères » dans les deux cas.

> dans cette "fausse" police hindi, et ensuite d'avoir un script
> automatique de remplacement qui permet de remettre les bonnes valeurs.

Oui. Mais ce n'est pas aussi simple à faire que ta description pourrait le
laisser supposer ;-)


> Le résultat ne serait peut-être pas
> parfait, mais sera déjà beaucoup plus proche des normes.

En fait, je pense que l'on peut faire du quasiment parfait.


> Des outils plus répandus sous unix que sous dos tel que perl, sed ou
> awk seraient une solution pour automatiser cela.

Ou VBA, le langage de macros de Word : avantage, il est possible de
remplacer d'un seul coup le caractères (ASCII) original par un caractère
Unicode du bloc U+09xx ; on change aussi la police en Mangal ou autre, et le
tour est joué.

Le plus long dans ce genre de trucs, c'est repérer _toutes_ les séquences
qu'il faut trafiquer.


Antoine


<Prev in Thread] Current Thread [Next in Thread>