<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><br class=""><div><blockquote type="cite" class=""><div class="">Fundor333 wrote:</div><br class="Apple-interchange-newline"><div class="">
  

    <meta http-equiv="content-type" content="text/html; charset=iso-8859-15" class="">
  
  <div text="#000000" bgcolor="#FFFFFF" class="">
    Nella mia università (università Ca' Foscari di Venezia), nel corso
    di laurea di informatica è stata fatta una conferenza con <span lang="EN-US" class="">Apostolos N. Papadopoulos (</span><span style="text-align:justify" class="">Aristotle University</span><span style="text-align:justify" class=""> of </span><span style="text-align:justify" class="">Thessaloniki) che ha presentato Apache
      Spark. E' stato mostrato come creare programmi per sistemi
      distribuiti in cui si dividono il carico di lavoro su un db
      comune. <br class="">
      <br class="">
      Il tutto è stato mostrato in scala ma la libreria è disponibile
      anche in python ma ha detto che è ancora "instabile" rispetto a
      quella java/scala.</span></div></div></blockquote><div><br class=""></div><div>Dunque, facciamo un po' di chiarezza: che cosa delle API di Python sarebbe "instabile"?</div><div>Non credo che il termine "instabile" sia il termine giusto, o per lo meno, non credo sia quello che intendi tu: non si tratta di instabilità, quanto più di non allineamento di feature a parità di API.</div><div>Al meglio della mia conoscenza, il maggiore investimento sulle API di Spark è stato fatto per Scala (del resto Spark è scritto in Scala e le API sono tutti dei wrapper per Scala, in fin dei conti).</div><div>Nella lista seguono, nell'ordine Java, Python, R.</div><div>In altre parole, il supporto per le cutting-edge features di Spark le troverai *sempre* in Scala e poi negli altri linguaggi in ordine più o meno "costantemente arbitrario" :)</div><div><br class=""></div><div>Tutto qui: non si tratta di instabilità. La API rilasciate sono *naturalmente* stabili.</div><div>Un esempio di confronto tra Python e Scala.</div><div><br class=""></div><div>Spark Streaming è stato introdotto in Python in una delle ultime release delle API (1.4.1, se non erro). Spark GraphX non è al momento supportato in Python (solo Scala e Java).</div><div><br class=""></div><div>That's it.</div><div><br class=""></div><div>Poi, se vogliamo parlare delle API di Machine Learning (MLib) e delle potenzialità in termini di "Estimators e Learning Methods", allora è un'altra storia… ma non mi pare che tu ne abbia fatto cenno.</div><br class=""><blockquote type="cite" class=""><div class=""><div text="#000000" bgcolor="#FFFFFF" class=""><span style="text-align:justify" class=""> Vista la fiera dell'elettronica a Venezia il 19
      e 20 dicembre, io e un altro mio compagno volevamo sperimentare
      delle cose sui sistemi distribuiti utilizzando raspberry
      (pensavamo quelli da 5 dollari) però in python.<br class=""></span></div></div></blockquote><div><br class=""></div><div>Quindi, se capisco bene, vuoi mettere su un cluster di raspberry pi su cui far girare Spark?</div><div>Ripeto: deve sempre essere possibile eseguire la JVM, eh?! Non dimenticarlo.</div><div>Torno a dire: Spark è implementato in Scala. Tutto diventa Scala, alla fine della fiera.</div><br class=""><blockquote type="cite" class=""><div class=""><div text="#000000" bgcolor="#FFFFFF" class=""><span style="text-align:justify" class="">
      <br class="">
      Quindi, qualcuno ha avuto esperienze con questo Apache Spark? E'
      davvero instabile? Che alternative abbiamo in python? </span></div></div></blockquote><div><br class=""></div><div>Scala, ma non so se sia **davvero** un'alternativa.</div><br class=""><blockquote type="cite" class=""><div class=""><div text="#000000" bgcolor="#FFFFFF" class=""><span style="text-align:justify" class="">Vale la pena
      fare questo lavoro in Python o meglio un altro linguaggio?<br class=""></span></div></div></blockquote><div><br class=""></div><div>Quale lavoro?! XD</div><div>In effetti su questo non sei stato molto chiaro. Come ha già detto qualcuno, meglio che decidi bene prima *cosa* fare e poi *come farlo*.</div><br class=""><blockquote type="cite" class=""><div class=""><div text="#000000" bgcolor="#FFFFFF" class=""><span style="text-align:justify" class="">
      <br class="">
      Grazie F333<br class=""></span></div></div></blockquote><div><br class=""></div>HTH<br class=""><br class=""><blockquote type="cite" class=""><div class=""><div text="#000000" bgcolor="#FFFFFF" class=""><span style="text-align:justify" class="">
      <br class="">
      PS:Vorremmo evitare C, C# e C++ perchè li troviamo "scomodi" per
      un progetto a "tempo perso" in quanto richiederebbero per noi
      tanto tempo per imparare come dio comanda il linguaggio<br class=""></span></div></div></blockquote><div><br class=""></div><div>Su C#, niente da dire (nel senso che non reputo *fondamentale* conoscere il C#)</div><div>Ma intendi dire che sei uno studente di Informatica all'università e non conosci almeno uno tra C o C++?! O_o</div><div>Su questo, qualcosina da dire ce l'avrei, btw.</div><div><br class=""></div><div>---</div><div>Valerio</div><div><br class=""></div></div></body></html>