<html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body dir="auto"><div><span></span></div><div><meta http-equiv="content-type" content="text/html; charset=utf-8"><div>Il </div><div><div>Sent from my iPad</div>On 17/nov/2014, at 12:39, enrico franchi <<a href="mailto:enrico.franchi@gmail.com">enrico.franchi@gmail.com</a>> wrote:<br><br></div><blockquote type="cite"><div><div dir="ltr">2014-11-17 11:32 GMT+00:00 Marco Ippolito <span dir="ltr"><<a href="mailto:ippolito.marco@gmail.com" target="_blank">ippolito.marco@gmail.com</a>></span>:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Resta da capire allora come mai i tipi di Theano:<br>
<a href="http://deeplearning.net/tutorial/gettingstarted.html" target="_blank">http://deeplearning.net/tutorial/gettingstarted.html</a><br>
<br>
usano e consigliano il formato pickle.<br clear="all"></blockquote><div><br>1. Cerca se da qualche parte lo spiegano (il perche' *loro* lo consigliano puo' essere spiegato solo da loro)<br>2. Magari pensano sia piu' semplice<br>3. Magari hanno uno use case, potenzialmente diverso dal tuo, per cui gli viene comodo<br>4. Magari hanno iniziato cosi' e sono andati avanti cosi' senza nessun motivo specifico<br>5. Magari pensano che sia didatticamente piu' utile(?)/semplice(?)<br> </div></div>Come ogni fonte su Internet, non e' "il modo giusto", a meno che non ti spieghino in modo accurato quali siano i pro e i contro, quello che scrivano e' corretto, e tu rientri nel loro stesso use-case.<br></div></div></div></blockquote><div><br></div><div>Non potrei essere più d'accordo!!</div><br><blockquote type="cite"><div><div dir="ltr"><div class="gmail_extra"><br>Personalmente, se devi spesso lavorare con matrici grosse su disco io valuterei anche usare oggettini come pytables e/o PyHDF5 o come cavolo si chiama. Potenziale flame su quale sia meglio... ancora una volta, bisogna capire quale sia il tuo use-case.<br></div></div></div></blockquote><div><br></div>Aggiungo: sono due soluzioni per lo stesso formato di gilè:hdf5<div>In generale, Il formato è  particolarmente adatto a dati strutturati in qualche modo, magari con una qualche specie di gerarchia.</div><div><br></div><div>Da quello che intuisco, Il vantaggio che avresti è quello di avere un formato di salvataggio efficiente e facilmente comprimibile ( facile nel senso che esistono già delle funzioni integrate per il salvataggio compresso).</div><div><br></div><div>In ogni caso, compressione a parte, se il tuo UC è quello di singola matrice, molto grande, IMHO la serializzazione di numpy è quello che ti serve.. Oppure tenta la strada di `memmap`</div><div><br></div><div>HTH</div><div>--<blockquote type="cite"><div><div dir="ltr"><div class="gmail_extra"></div></div></div></blockquote></div></div><div>Valerio</div></body></html>