<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">Il giorno 20 maggio 2016 16:05, Pietro Battiston <span dir="ltr"><<a href="mailto:ml@pietrobattiston.it" target="_blank">ml@pietrobattiston.it</a>></span> ha scritto:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
> >  - "multiprocessing" implica (a meno di eccezioni notevoli) "pickle<br>
> > di<br>
> > tutto"<br>
> ? cioè i dati vengono trasmessi via pickle e non via puntatori? Sure?<br>
> O invece non ho capito cosa affermi? Sorry per la mia ignoranza, ma<br>
> sono anziano e con i capelli MOLTO grigi. <br></blockquote><div><br></div><div>Qualche aiuto/commento? Per caso usi pickle per passare copie di dati? </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Il dubbio che mi resta davanti a quei grafici è come sia possibile che<br>
passando da 1 a 2, o 3, core si ottenga una riduzione (piccola ma<br>
abbastanza evidente) del work time. Potrà essere dovuto al fatto che i<br>
vari processi fanno esattamente lo stesso lavoro e c'è una qualche<br>
forma di caching intelligente tra core?<br></blockquote><div><br></div><div>Credo sia dovuto all'uso che fanno di ast. Questo w.e. speravo di avere</div><div>il tempo di dare un'occhiata ravvicinata al loro codice, ma è stata una speranza</div><div>invana: mia morosa ha altri problemi :-(</div><div><br></div><div>Amen: altra cosa al domani.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
> > ovunque ci sia un array numpy), dask ( <a href="http://dask.pydata.org" rel="noreferrer" target="_blank">http://dask.pydata.org</a> ;) mi<br>
> > sembra la salvezza (finora per quel che mi riguarda ci ho fatto<br>
> > solo<br><br>
Concordo. Ma dask è in un certo senso estremamente semplice. Se<br>
soddisfa le tue necessità e le tue necessità coinvolgono un array numpy<br>
grosso, le operazioni che fai saranno praticamente identiche<br>
all'utilizzo di numpy... tranne che saranno distribuite su tutto quel<br>
che ti pare.<br>
(A me poi interessa particolarmente il supporto per le strutture<br>
pandas)<br></blockquote><div><br></div><div>Raro abbia necessità di calcoli complessi. Molto più spesso è solo gestione</div><div>di dati non omogenei. E, praticamente sempre non ho alcuna necessità di</div><div>scrivere codice che funzioni veloce, quanto di scrivere veloce del codice che funzioni. </div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Quello che devo ancora capire è solo quale fetta delle mie necessità<br>
soddisfi!<br></blockquote><div><br></div><div>Quella che ti serve al momento!  :-)</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Pietro<br></blockquote><div><br></div><div>Alex </div><div><br></div><div>ps: sistu Veneto? Io di Padova: <a href="http://www.fsugpadova.org">www.fsugpadova.org</a></div></div><br></div></div>