[Python] Usare Unicode e charset

Nicola Larosa nico a tekNico.net
Gio 3 Dic 2009 10:41:29 CET


Marco Mariani wrote:
> Se ASCII non ti basta, controlla di avere l'editor configurato per
> UTF-8 e metti
> # -*- coding: utf-8 -*-
> 
> in testa ai tuoi file.
> 
> In questo modo,  a = 'àè' sara' una stringa di 4 byte, la 
> rappresentazione UTF-8 delle due vocali accentate
> 
> Invece a=u'àè' sara' una stringa unicode di 2 codepoint.

Continuo la spiegazione: l'interprete Python ha *decodificato* i 4 byte
usando l'encoding UTF-8, e generando la stringa unicode contenente 2
codepoint.

Se l'editor avesse salvato il file usando, per esempio, l'encoding
ISO-8859-1, in conflitto con la dichiarazione in cima al file, avresti
ottenuto dei codepoint sbagliati, o più probabilmente un errore.

-- 
Nicola Larosa - http://www.tekNico.net/

The standard stereotypes of women are virgin, whore, mommy, and cheer-
leader/"pet". These stereotypical roles are not whole persons; they are
all about women-in-relation-to-men. The fifth stereotype, "bitch", is
often applied to women who refuse to conform to any of those four.
 - Victoria G. Laidler, September 2009


Maggiori informazioni sulla lista Python