[Pycon] [new paper] "Domenico Gioia" - BigData e Apache Spark
info a pycon.it
info a pycon.it
Dom 30 Dic 2018 23:35:25 CET
Title: BigData e Apache Spark
Duration: 45 (includes Q&A)
Q&A Session: 15
Language: it
Type: Talk
Abstract: Introduzione ad Apache Spark ed Hadoop per l'analisi di Big Data.
Spark insieme ad Hadoop rendono possibile fare storage distribuito e calcolo distribuito. I dati crescono sempre più velocemente e diventano sempre più grandi. Abbiamo bisogno di tecnologie che scalano al crescere dei dati. Introdurremo il concetto di Horizzontal e Linear Scalability.
Vedremo esempi di codice Python e/o Scala per usare Spark e vedremo come Spark SQL permette di interrogare grandi quantità di dati usando il noto e comodo linguaggio SQL e come Spark MLlib permette di usare algoritmi di machine learning sui BigData.
La presentazione è per chiunque sia curioso riguardo ai BigData, Spark, Hadoop. Non è richiesto nessun requisito particolare.
Tags: [u'Big-Data', u'spark', u'hadoop']
Maggiori informazioni sulla lista
Pycon