[Python] Usare Unicode e charset
Nicola Larosa
nico a tekNico.net
Gio 3 Dic 2009 10:41:29 CET
Marco Mariani wrote:
> Se ASCII non ti basta, controlla di avere l'editor configurato per
> UTF-8 e metti
> # -*- coding: utf-8 -*-
>
> in testa ai tuoi file.
>
> In questo modo, a = 'àè' sara' una stringa di 4 byte, la
> rappresentazione UTF-8 delle due vocali accentate
>
> Invece a=u'àè' sara' una stringa unicode di 2 codepoint.
Continuo la spiegazione: l'interprete Python ha *decodificato* i 4 byte
usando l'encoding UTF-8, e generando la stringa unicode contenente 2
codepoint.
Se l'editor avesse salvato il file usando, per esempio, l'encoding
ISO-8859-1, in conflitto con la dichiarazione in cima al file, avresti
ottenuto dei codepoint sbagliati, o più probabilmente un errore.
--
Nicola Larosa - http://www.tekNico.net/
The standard stereotypes of women are virgin, whore, mommy, and cheer-
leader/"pet". These stereotypical roles are not whole persons; they are
all about women-in-relation-to-men. The fifth stereotype, "bitch", is
often applied to women who refuse to conform to any of those four.
- Victoria G. Laidler, September 2009
Maggiori informazioni sulla lista
Python