Menu

Caractères invalides

MELA
2015-04-04
2015-04-04
  • MELA

    MELA - 2015-04-04

    Bonsoir chers amis . Comment peux t'on identifier les caractères invalides . Un grand merci

     
  • THEVENOT Guy

    THEVENOT Guy - 2015-04-04

    Bonjour MELA,

    Que veux-tu dire exactement ?

    En général, un caractère est invalide, pour 1 ou plusieurs encodages spécifiques !

    Par exemple, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM, le caractère \xC1 est un caractère invalide, qui apparaitra, sous la forme xC1, en vidéo inversée, dans Notepad++

    Autre exemple : le caractère cyrillique Ж, avec UNICODE code-point \xC6 en héxadécimal / 198 en décimal, dans un fichier encodé en Windows-1251, n'est PLUS visualisable si ce fichier est RÉ-encodé en Windows-1252. Il y aura, à la place la ligature Æ, de même code-point UNICODE \xC6.

    Logique ! Seul un encodage strictement UNICODE, permettant l'écriture des caractères des principales langues, ou un encodage cyrillique spécifique permet l'affichage correct de la lettre cyrillique majuscule Ж

    Pour mémoire, la lettre cyrillique Ж, de valeur UNICODE \x0416, ne peut-être correctement affichée qu'avec les SEULS encodages ci-dessous et s'écrira :

    • avec 2 octets 04 16, dans un fichier, encodé en UCS-2 Big Endian

    • avec 2 octets 16 04, dans un fichier, encodé en UCS-2 Little Endian

    • avec 2 octets D0 96, dans un fichier, encodé en UTF-8 ou en UTF-8 without BOM

    • avec l'octet C6, dans un fichier, encodé en Windows-1251 ( Cyrillic )

    • avec l'octet C6, dans un fichier, encodé en ANSI ( si langue par défaut de l'ordinateur = Windows-1251 )

    • avec l'octet EA, dans un fichier, encodé en OEM-855 ( Cyrillic )

    • avec l'octet 86, dans un fichier, encodé en OEM-866 ( Russian )

    • avec l'octet B6, dans un fichier, encodé en ISO-8859-5 ( Windows-28595 )

    Donc, MELA, j'attends quelques précisions supplémentaires pour une réponse plus ciblée :-)

    Amitiés,

    guy038

     

    Last edit: THEVENOT Guy 2015-04-04
  • MELA

    MELA - 2015-04-04

    Je te remercie pour toutes ces explication . Alors déjà mon fichier était en format unix au lieux de windows . L'encodage est UTF-16LE . C'est une traduction et une personne tiers devait transformer mon fichier.text eb Global.res et a détecté des caractères invalides . Comme je débute avec ce programme j'ai du faire des bétises . Mais je te remercie .