En général, un caractère est invalide, pour 1 ou plusieurs encodages spécifiques !
Par exemple, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM, le caractère \xC1 est un caractère invalide, qui apparaitra, sous la forme xC1, en vidéo inversée, dans Notepad++
Autre exemple : le caractère cyrillique Ж, avec UNICODE code-point \xC6 en héxadécimal / 198 en décimal, dans un fichier encodé en Windows-1251, n'est PLUS visualisable si ce fichier est RÉ-encodé en Windows-1252. Il y aura, à la place la ligature Æ, de même code-point UNICODE \xC6.
Logique ! Seul un encodage strictement UNICODE, permettant l'écriture des caractères des principales langues, ou un encodage cyrillique spécifique permet l'affichage correct de la lettre cyrillique majusculeЖ
Pour mémoire, la lettre cyrillique Ж, de valeur UNICODE \x0416, ne peut-être correctement affichée qu'avec les SEULS encodages ci-dessous et s'écrira :
avec 2 octets 04 16, dans un fichier, encodé en UCS-2 Big Endian
avec 2 octets 16 04, dans un fichier, encodé en UCS-2 Little Endian
avec 2 octets D0 96, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM
avec l'octet C6, dans un fichier, encodé en Windows-1251 ( Cyrillic )
avec l'octet C6, dans un fichier, encodé en ANSI ( si langue par défaut de l'ordinateur = Windows-1251 )
avec l'octet EA, dans un fichier, encodé en OEM-855 ( Cyrillic )
avec l'octet 86, dans un fichier, encodé en OEM-866 ( Russian )
avec l'octet B6, dans un fichier, encodé en ISO-8859-5 ( Windows-28595 )
Donc, MELA, j'attends quelques précisions supplémentaires pour une réponse plus ciblée :-)
Amitiés,
guy038
Last edit: THEVENOT Guy 2015-04-04
If you would like to refer to this comment somewhere else in this project, copy and paste the following link:
Je te remercie pour toutes ces explication . Alors déjà mon fichier était en format unix au lieux de windows . L'encodage est UTF-16LE . C'est une traduction et une personne tiers devait transformer mon fichier.text eb Global.res et a détecté des caractères invalides . Comme je débute avec ce programme j'ai du faire des bétises . Mais je te remercie .
If you would like to refer to this comment somewhere else in this project, copy and paste the following link:
Bonsoir chers amis . Comment peux t'on identifier les caractères invalides . Un grand merci
Bonjour MELA,
Que veux-tu dire exactement ?
En général, un caractère est invalide, pour 1 ou plusieurs encodages spécifiques !
Par exemple, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM, le caractère
\xC1
est un caractère invalide, qui apparaitra, sous la formexC1
, en vidéo inversée, dans Notepad++Autre exemple : le caractère cyrillique Ж, avec UNICODE code-point
\xC6
en héxadécimal / 198 en décimal, dans un fichier encodé en Windows-1251, n'est PLUS visualisable si ce fichier est RÉ-encodé en Windows-1252. Il y aura, à la place la ligatureÆ
, de même code-point UNICODE\xC6
.Logique ! Seul un encodage strictement UNICODE, permettant l'écriture des caractères des principales langues, ou un encodage cyrillique spécifique permet l'affichage correct de la lettre cyrillique majuscule Ж
Pour mémoire, la lettre cyrillique Ж, de valeur UNICODE
\x0416
, ne peut-être correctement affichée qu'avec les SEULS encodages ci-dessous et s'écrira :avec 2 octets 04 16, dans un fichier, encodé en UCS-2 Big Endian
avec 2 octets 16 04, dans un fichier, encodé en UCS-2 Little Endian
avec 2 octets D0 96, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM
avec l'octet C6, dans un fichier, encodé en Windows-1251 ( Cyrillic )
avec l'octet C6, dans un fichier, encodé en ANSI ( si langue par défaut de l'ordinateur = Windows-1251 )
avec l'octet EA, dans un fichier, encodé en OEM-855 ( Cyrillic )
avec l'octet 86, dans un fichier, encodé en OEM-866 ( Russian )
avec l'octet B6, dans un fichier, encodé en ISO-8859-5 ( Windows-28595 )
Donc, MELA, j'attends quelques précisions supplémentaires pour une réponse plus ciblée :-)
Amitiés,
guy038
Last edit: THEVENOT Guy 2015-04-04
Je te remercie pour toutes ces explication . Alors déjà mon fichier était en format unix au lieux de windows . L'encodage est UTF-16LE . C'est une traduction et une personne tiers devait transformer mon fichier.text eb Global.res et a détecté des caractères invalides . Comme je débute avec ce programme j'ai du faire des bétises . Mais je te remercie .