[Pycon] [new paper] "Domenico Gioia" - BigData e Apache Spark

info a pycon.it info a pycon.it
Dom 30 Dic 2018 23:35:25 CET


Title: BigData e Apache Spark 
Duration: 45 (includes Q&A)
Q&A Session: 15
Language: it
Type: Talk

Abstract: Introduzione ad Apache Spark ed Hadoop per l'analisi di Big Data.
Spark insieme ad Hadoop rendono possibile fare storage distribuito e calcolo distribuito. I dati crescono sempre più velocemente e diventano sempre più grandi. Abbiamo bisogno di tecnologie che scalano al crescere dei dati. Introdurremo il concetto di Horizzontal e Linear Scalability.
Vedremo esempi di codice Python e/o Scala per usare Spark e vedremo come Spark SQL permette di interrogare grandi quantità di dati usando il noto e comodo linguaggio SQL e come Spark MLlib permette di usare algoritmi di machine learning sui BigData.
La presentazione è per chiunque sia curioso riguardo ai BigData, Spark, Hadoop. Non è richiesto nessun requisito particolare.

Tags: [u'Big-Data', u'spark', u'hadoop']


Maggiori informazioni sulla lista Pycon