[Python] Domanda facile facile su caso manipolazione unicode

Nicola Larosa nico a tekNico.net
Gio 29 Gen 2015 12:26:17 CET


Marco Ippolito wrote:
> http definisce un parametro charset nell'header Content-type per cui
> pensavo, probabilmente sbagliando visto il messaggio che non so be
> decifrare che mi lancia python quando salvo il file con encoding 
> iso-8859-1, che fosse :<meta http-equiv="Content-Type" 
> content="text/html; charset=iso-8859-1">

Attenzione alla differenza tra HTTP e HTML.

Quella doc si riferisce all'header HTTP inviato nella response *prima*
del content, cioè prima della pagina HTML.

Il tag <meta> riporti proviene dalla sezione <head> di una pagina HTML.

Header HTTP e <head> HTML sono due cose diverse.


Tra l'altro, suggerisco caldamente di non fare grande affidamento su
nessuno dei due per quanto riguarda l'encoding. Là fuori è pieno di
server HTTP e di pagine HTML che mentono allegramente al riguardo.

Il rilevamento automatico dell'encoding è basato su euristiche che
possono fallire, ma ho paura sia il meglio che tu possa fare.

-- 
Nicola 'tekNico' Larosa <http://www.tekNico.net/>

Non facciamo convegni. O meglio facciamo convegni senza convegno.
Visto che poi ai convegni le cose importanti ce le si dice al bar
abbiamo deciso di fare convegni con solo il bar, senza le relazioni
e i microfoni. - Jacopo Fo, settembre 2014


Maggiori informazioni sulla lista Python