[Python] Usare Unicode e charset
Manlio Perillo
manlio_perillo a libero.it
Gio 3 Dic 2009 12:56:53 CET
Marco Mariani ha scritto:
> Manlio Perillo wrote:
>
>> Uff, questo 6 bits ora da dove è uscito? ...
>>
>
> Ho controllato. Con UTF-8 il massimo e' 4 bytes
>
Ma UTF-8 è giusto una codifica.
> Da wikipedia:
>
> The original specification allowed for sequences of up to six bytes
> covering numbers up to 31 bits (the original limit of the Universal
> Character Set <http://en.wikipedia.org/wiki/Universal_Character_Set>).
> However, UTF-8 was restricted by RFC 3629
> <http://tools.ietf.org/html/rfc3629> to use only the area covered by the
> formal Unicode definition, U+|0000| to U+|10FFFF|, in November 2003.
>
Che tra l'altro risolve anche alcuni problemi di sicurezza che erano
presenti in UTF-8.
Ciao Manlio
Maggiori informazioni sulla lista
Python