[Python] aiuto : pulizia dataset / stato di limitazioni con twitter

Daniele Zambelli daniele.zambelli a gmail.com
Dom 4 Feb 2018 09:48:51 CET


Il giorno 3 febbraio 2018 19:06, Andrea Lampitto <AndreaLampitto a live.it>
ha scritto:
[...]

> Questo è un compito universitario che devo fare, mi sono reso conto dopo
> che era più avanzato rispetto le mie conoscenze di python,
> devo rispondere a questi 4 quesiti entro il 12 febbraio, ma non so dove
> mettere le mani.
> vi allego i file che devo usare spero che qualcuno possa aiutarmi !
> grazie!! (sa.txt sono i twitter che escono dalla query, exam1 è il
> programma che ho usato per trovare i tweet )
>
> 1. data cleaning - removing stopwords, converting to lowercase, removing
> punctuation etc.
> 2. using better metrics - e.g. removing the len (number of characters)
> metric which didn't seem useful for answering your research questions
> 3. stating limitation of research (when it comes to generalization, how
> much data you have, for which timeframe etc.)
> 4. comment the code (explain why and what is happening in it)
>

Premetto che non so niente di twitter.

Il compito che devi risolvere è: produrre un file di testo ottenuto
modificando  il file sa.txt?

Se il problema è questo io partirei scrivendo un programma che legge riga
per riga il file di partenza e scrive, riga per riga il file prodotto;
senza alcuna modifica.

Poi inserirei una funzione che produce le modifiche richieste (e che io non
ho capito).

Ciao

-- 

Daniele

www.fugamatematica.blogspot.com

    giusto!
    nel verso
    forse è perché non guardiamo le cose
    Quando non ci capiamo,
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20180204/e4f9493d/attachment.html>


Maggiori informazioni sulla lista Python