[Python] Pandas ed Encoding

Gollum1 gollum1.smeagol1 a gmail.com
Mar 9 Feb 2016 08:26:54 CET


Il 08 febbraio 2016 22:37:59 CET, Christian Barra <barrachri a gmail.com> ha scritto:
>Il giorno 8 febbraio 2016 21:04, Andrea D'Amore <and.damore a gmail.com>
>ha
>scritto:
>
>> 2016-02-08 19:19 GMT+01:00 Christian Barra <barrachri a gmail.com>:
>> >> curl -I 'urlDaDoveScaricoUnFileCSV'
>>
>> > "<p>Il vino bianco D.O.C. 5 terre � ricavato....
>>
>> Ok ma l'uscita di curl qual è?
>
>
>curl -I 'urlDaDoveScaricoUnFileCSV'
>poi sono semplicemente andato a riprendere la stringa di testo che ho
>utilizzato come esempio finora.
>
>Problemi con la configurazione in locale ? Potrebbe anche essere....ma
>ho
>configurato il bash_profile proprio in mattinata
>
># Export LANG
>export LANG="en_US.UTF-8"
>export LC_MONETARY="it_IT.UTF-8"
>export LC_NUMERIC="it_IT.UTF-8"
>export LC_TIME="it_IT.UTF-8"
>
>Allora...ho fatto un po di test.
>
>df_witouht_urlib = pd.read_csv(URL,encoding = "latin-1")
>s = df_witouht_urlib.loc[1,"DESCRIZIONE"]
>print(type(s))
>
><class 'str'>
>
>
>s.__repr__()
>
>
>'"<p>Il vino bianco D.O.C. 5 terre è
>
>
>-----
>
>
>response = urllib.request.urlretrieve(URL, "data.csv")
>df_with_urlib = pd.read_csv("data.csv", encoding = "latin-1")
>s = df_with_urlib.loc[1,"DESCRIZIONE"]
>print(type(s))
>
>
><class 'str'>
>
>
>s.__repr__()
>
>'"<p>Il vino bianco D.O.C. 5 terre è ricavato
>
>
>-----
>
>
>response = urllib.request.urlopen(URL)
>data = response.read()
>
>print(type(data))
>
>
><class 'bytes'>
>
>
>data.__repr__()
>
>"<p>Il vino bianco D.O.C. 5 terre \\xe8 ricavato
>
>
>data.decode("latin-1")
>
>"<p>Il vino bianco D.O.C. 5 terre è ricavato
>
Bravissimo a non aver fatto il top quoting, ora un passo in più, tutta la parte seguente alla tua risposta, che non serve più, cancellala, e in ogni caso, cancella firma e disclaimer del post a cui rispondi.
Byez
-- 
Gollum1

Inviato dal mio dispositivo Android con K-9 Mail. Perdonate la brevità e gli errori di battitura (maledetto correttore ortografico).


Maggiori informazioni sulla lista Python