[Python] Pandas ed Encoding

Christian Barra barrachri a gmail.com
Lun 8 Feb 2016 22:37:59 CET


Il giorno 8 febbraio 2016 21:04, Andrea D'Amore <and.damore a gmail.com> ha
scritto:

> 2016-02-08 19:19 GMT+01:00 Christian Barra <barrachri a gmail.com>:
> >> curl -I 'urlDaDoveScaricoUnFileCSV'
>
> > "<p>Il vino bianco D.O.C. 5 terre � ricavato....
>
> Ok ma l'uscita di curl qual è?


curl -I 'urlDaDoveScaricoUnFileCSV'
poi sono semplicemente andato a riprendere la stringa di testo che ho
utilizzato come esempio finora.

Problemi con la configurazione in locale ? Potrebbe anche essere....ma ho
configurato il bash_profile proprio in mattinata

# Export LANG
export LANG="en_US.UTF-8"
export LC_MONETARY="it_IT.UTF-8"
export LC_NUMERIC="it_IT.UTF-8"
export LC_TIME="it_IT.UTF-8"

Allora...ho fatto un po di test.

df_witouht_urlib = pd.read_csv(URL,encoding = "latin-1")
s = df_witouht_urlib.loc[1,"DESCRIZIONE"]
print(type(s))

<class 'str'>


s.__repr__()


'"<p>Il vino bianco D.O.C. 5 terre è


-----


response = urllib.request.urlretrieve(URL, "data.csv")
df_with_urlib = pd.read_csv("data.csv", encoding = "latin-1")
s = df_with_urlib.loc[1,"DESCRIZIONE"]
print(type(s))


<class 'str'>


s.__repr__()

'"<p>Il vino bianco D.O.C. 5 terre è ricavato


-----


response = urllib.request.urlopen(URL)
data = response.read()

print(type(data))


<class 'bytes'>


data.__repr__()

"<p>Il vino bianco D.O.C. 5 terre \\xe8 ricavato


data.decode("latin-1")

"<p>Il vino bianco D.O.C. 5 terre è ricavato




Il giorno 8 febbraio 2016 21:52, Gollum1 <gollum1.smeagol1 a gmail.com> ha
scritto:

> Il 08 febbraio 2016 21:46:37 CET, Roberto Polli <robipolli a gmail.com> ha
> scritto:
> >Scusate il TP
> >
> >Il 8 febbraio 2016 21:17, Manlio Perillo <manlio.perillo a gmail.com> ha
> >scritto:
> >>>> >>> print(repr(s))
> >__repr__ don't print ;)
> >
> >Pace,
> >R.
> >_______________________________________________
> >Python mailing list
> >Python a lists.python.it
> >http://lists.python.it/mailman/listinfo/python
>
> Salvato in corner...
> O era coroner?
>
> :-P
> --
> Gollum1
>
> Inviato dal mio dispositivo Android con K-9 Mail. Perdonate la brevità e
> gli errori di battitura (maledetto correttore ortografico).
> _______________________________________________
> Python mailing list
> Python a lists.python.it
> http://lists.python.it/mailman/listinfo/python
>



-- 

I wish you a good day,
Christian
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20160208/f00c250b/attachment-0001.html>


Maggiori informazioni sulla lista Python