Encodage

De drev
Aller à : navigation, rechercher

Differance entre Unicode et UTF-8

  • Unicode: Standard représentant les caractères du monde entier par une liste de "code point" séquentiel sans tenir compte de l'encodage en machine.
  • UTF-8: Encodage d'un "code point" unicode par 8 bits (1 octet).

En fonction de la plage du "code point", le nombre d'octet est variable par exemple les caractères en dessous de 127 sont encodée sur 1 octets (caractères latin) puis 2 jusqu'a 6 octets en fonction de la complexités du caractère.

Sources

http://www.joelonsoftware.com/articles/Unicode.html

Bibliographie

http://unicode-table.com/