[Python] Usare Unicode e charset

Marco Beri marcoberi a gmail.com
Gio 3 Dic 2009 11:43:28 CET


2009/12/3 Marco Mariani <marco.mariani a prometeia.it>

> Stringa unicode (u'hello world'): sequenza di codepoint.
> Ci sono oltre un milione di codepoint differenti, ognuno rappresentato
> da 1 a 5-6 byte
>

Quelli usati sinora sono poco più di 100.000: "In all, the Unicode Standard,
Version 5.1 provides codes for 100,713 characters from the world's
alphabets, ideograph sets, and symbol collections."

Se non erro, però, ci potranno essere caratteri definiti fino a 8 bytes
(ripeto: se non erro!).

Ciao.
Marco.

-- 
http://ThinkCode.TV - Screencast e videocorsi di programmazione
http://stacktrace.it - Aperiodico di resistenza informatica
http://beri.it - Blog di una testina di vitello
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: http://lists.python.it/pipermail/python/attachments/20091203/0784832f/attachment.htm 


Maggiori informazioni sulla lista Python