<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">Il giorno 20 maggio 2016 16:05, Pietro Battiston <span dir="ltr"><<a href="mailto:ml@pietrobattiston.it" target="_blank">ml@pietrobattiston.it</a>></span> ha scritto:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

> >  - "multiprocessing" implica (a meno di eccezioni notevoli) "pickle<br>

> > di<br>

> > tutto"<br>

> ? cioè i dati vengono trasmessi via pickle e non via puntatori? Sure?<br>

> O invece non ho capito cosa affermi? Sorry per la mia ignoranza, ma<br>

> sono anziano e con i capelli MOLTO grigi. <br></blockquote><div><br></div><div>Qualche aiuto/commento? Per caso usi pickle per passare copie di dati? </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>

Il dubbio che mi resta davanti a quei grafici è come sia possibile che<br>

passando da 1 a 2, o 3, core si ottenga una riduzione (piccola ma<br>

abbastanza evidente) del work time. Potrà essere dovuto al fatto che i<br>

vari processi fanno esattamente lo stesso lavoro e c'è una qualche<br>

forma di caching intelligente tra core?<br></blockquote><div><br></div><div>Credo sia dovuto all'uso che fanno di ast. Questo w.e. speravo di avere</div><div>il tempo di dare un'occhiata ravvicinata al loro codice, ma è stata una speranza</div><div>invana: mia morosa ha altri problemi :-(</div><div><br></div><div>Amen: altra cosa al domani.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

> > ovunque ci sia un array numpy), dask ( <a href="http://dask.pydata.org" rel="noreferrer" target="_blank">http://dask.pydata.org</a> ;) mi<br>

> > sembra la salvezza (finora per quel che mi riguarda ci ho fatto<br>

> > solo<br><br>

Concordo. Ma dask è in un certo senso estremamente semplice. Se<br>

soddisfa le tue necessità e le tue necessità coinvolgono un array numpy<br>

grosso, le operazioni che fai saranno praticamente identiche<br>

all'utilizzo di numpy... tranne che saranno distribuite su tutto quel<br>

che ti pare.<br>

(A me poi interessa particolarmente il supporto per le strutture<br>

pandas)<br></blockquote><div><br></div><div>Raro abbia necessità di calcoli complessi. Molto più spesso è solo gestione</div><div>di dati non omogenei. E, praticamente sempre non ho alcuna necessità di</div><div>scrivere codice che funzioni veloce, quanto di scrivere veloce del codice che funzioni. </div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Quello che devo ancora capire è solo quale fetta delle mie necessità<br>

soddisfi!<br></blockquote><div><br></div><div>Quella che ti serve al momento!  :-)</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Pietro<br></blockquote><div><br></div><div>Alex </div><div><br></div><div>ps: sistu Veneto? Io di Padova: <a href="http://www.fsugpadova.org">www.fsugpadova.org</a></div></div><br></div></div>