[Python] Usare Unicode e charset

Manlio Perillo manlio_perillo a libero.it
Gio 3 Dic 2009 12:56:53 CET


Marco Mariani ha scritto:
> Manlio Perillo wrote:
> 
>> Uff, questo 6 bits ora da dove è uscito? ...
>>   
> 
> Ho controllato. Con UTF-8 il massimo e' 4 bytes
> 

Ma UTF-8 è giusto una codifica.

> Da wikipedia:
> 
> The original specification allowed for sequences of up to six bytes 
> covering numbers up to 31 bits (the original limit of the Universal 
> Character Set <http://en.wikipedia.org/wiki/Universal_Character_Set>). 
> However, UTF-8 was restricted by RFC 3629 
> <http://tools.ietf.org/html/rfc3629> to use only the area covered by the 
> formal Unicode definition, U+|0000| to U+|10FFFF|, in November 2003.
> 

Che tra l'altro risolve anche alcuni problemi di sicurezza che erano
presenti in UTF-8.



Ciao  Manlio



Maggiori informazioni sulla lista Python