[Python] aiuto : pulizia dataset / stato di limitazioni con twitter

Andrea Lampitto AndreaLampitto a live.it
Sab 3 Feb 2018 19:06:28 CET


Andrea Lampitto ha condiviso i file di OneDrive. Per visualizzarli, fare clic sui collegamenti seguenti.


<https://1drv.ms/t/s!AuA2Mhi1QEsYivgTj5u5fDiyxP8jOA>
[https://r1.res.office365.com/owa/prem/images/dc-txt_20.png]<https://1drv.ms/t/s!AuA2Mhi1QEsYivgTj5u5fDiyxP8jOA>

sa.txt<https://1drv.ms/t/s!AuA2Mhi1QEsYivgTj5u5fDiyxP8jOA>

<https://1drv.ms/u/s!AuA2Mhi1QEsYivgUnsYd9APWZsuxnA>
[https://r1.res.office365.com/owa/prem/images/dc-generic_20.png]<https://1drv.ms/u/s!AuA2Mhi1QEsYivgUnsYd9APWZsuxnA>

exam1.py<https://1drv.ms/u/s!AuA2Mhi1QEsYivgUnsYd9APWZsuxnA>




Questo è un compito universitario che devo fare, mi sono reso conto dopo che era più avanzato rispetto le mie conoscenze di python,
devo rispondere a questi 4 quesiti entro il 12 febbraio, ma non so dove mettere le mani.
vi allego i file che devo usare spero che qualcuno possa aiutarmi ! grazie!! (sa.txt sono i twitter che escono dalla query, exam1 è il programma che ho usato per trovare i tweet )

1. data cleaning - removing stopwords, converting to lowercase, removing punctuation etc.
2. using better metrics - e.g. removing the len (number of characters) metric which didn't seem useful for answering your research questions
3. stating limitation of research (when it comes to generalization, how much data you have, for which timeframe etc.)
4. comment the code (explain why and what is happening in it)


-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20180203/d00a2154/attachment.html>


Maggiori informazioni sulla lista Python