[Pycon] [new paper] "Fabio Lamanna" - Dalla lingua del tweet all'immigrazione nelle città: Python ed i "Language Detectors"

info a pycon.it info a pycon.it
Mer 10 Gen 2018 14:22:59 CET


Title: Dalla lingua del tweet all'immigrazione nelle città: Python ed i "Language Detectors"
Duration: 45 (includes Q&A)
Q&A Session: 0
Language: it
Type: Talk

Abstract: eh sì, ancora Twitter! In questo talk vorrei presentarvi l'utilizzo di Python nell'analisi del linguaggio di 350 milioni di tweets scritti da circa 15 milioni di utenti in 53 città del mondo negli ultimi 5 anni. Vedremo come siamo riusciti a ricavare la madrelingua più probabile di ciascun utente di Twitter analizzando la sua storia di cinguettii grazie a diversi pacchetti di analisi (cld2, LangId) ed a un bel po' di statistica!

Ci siamo poi concentrati sulla loro dislocazione spaziale nei centri urbani, costruendo uno speciale ranking in cui troviamo in cima le città più propense ad accogliere comunità di immigrati contro quelle che invece sono caratterizzate da fenomeni di "ghetto".

Grazie a Twitter abbiamo quindi sviluppato un metodo di analisi che ci aiuta a stimare come sono integrate/segregate dal punto di vista spaziale diverse comunità di immigrati nei maggiori centri urbani del pianeta.

Pre-requisiti: nessuno

Tags: [u'nlp', u'twitter', u'data-analysis', u'language', u'Social Network Analysis', u'social-media', u'pandas']


Maggiori informazioni sulla lista Pycon