Encodage
De drev
Differance entre Unicode et UTF-8
- Unicode: Standard représentant les caractères du monde entier par une liste de "code point" séquentiel sans tenir compte de l'encodage en machine.
- UTF-8: Encodage d'un "code point" unicode par 8 bits (1 octet).
En fonction de la plage du "code point", le nombre d'octet est variable par exemple les caractères en dessous de 127 sont encodée sur 1 octets (caractères latin) puis 2 jusqu'a 6 octets en fonction de la complexités du caractère.
Sources
http://www.joelonsoftware.com/articles/Unicode.html