[Python] aiuto : pulizia dataset / stato di limitazioni con twitter

Andrea Lampitto AndreaLampitto a live.it
Dom 4 Feb 2018 10:47:30 CET


mi potresti dire come si scrive un programma che legge riga per riga? potresti scrivermelo?

________________________________
Da: Python <python-bounces a lists.python.it> per conto di Daniele Zambelli <daniele.zambelli a gmail.com>
Inviato: sabato 3 febbraio 2018 23:48
A: Discussioni generali sul linguaggio Python
Oggetto: Re: [Python] aiuto : pulizia dataset / stato di limitazioni con twitter

Il giorno 3 febbraio 2018 19:06, Andrea Lampitto <AndreaLampitto a live.it<mailto:AndreaLampitto a live.it>> ha scritto:
[...]

Questo è un compito universitario che devo fare, mi sono reso conto dopo che era più avanzato rispetto le mie conoscenze di python,
devo rispondere a questi 4 quesiti entro il 12 febbraio, ma non so dove mettere le mani.
vi allego i file che devo usare spero che qualcuno possa aiutarmi ! grazie!! (sa.txt sono i twitter che escono dalla query, exam1 è il programma che ho usato per trovare i tweet )

1. data cleaning - removing stopwords, converting to lowercase, removing punctuation etc.
2. using better metrics - e.g. removing the len (number of characters) metric which didn't seem useful for answering your research questions
3. stating limitation of research (when it comes to generalization, how much data you have, for which timeframe etc.)
4. comment the code (explain why and what is happening in it)

Premetto che non so niente di twitter.

Il compito che devi risolvere è: produrre un file di testo ottenuto modificando  il file sa.txt?

Se il problema è questo io partirei scrivendo un programma che legge riga per riga il file di partenza e scrive, riga per riga il file prodotto; senza alcuna modifica.

Poi inserirei una funzione che produce le modifiche richieste (e che io non ho capito).

Ciao

--

Daniele

www.fugamatematica.blogspot.com<http://www.fugamatematica.blogspot.com>

    giusto!
    nel verso
    forse è perché non guardiamo le cose
    Quando non ci capiamo,
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20180204/c8c69fe2/attachment-0001.html>


Maggiori informazioni sulla lista Python