[Python] Proof of concept per un programma di scansione duplicati.

simozack simozackml a gmail.com
Gio 20 Giu 2013 08:29:21 CEST


Il 19 giugno 2013 11:49, Nicola Larosa <nico a teknico.net> ha scritto:
> Gollum1 wrote:
>> Ora mi ritrovo con una marea di file duplicati, a volte anche con
>> nomi diversi... ho provato diversi programmi che dovrebbero trovare
>> tutti i duplicati, ma per un verso o per l'altro non mi hanno mai
>> soddisfatto.

Avevo già fatto una cosa simile tempo fa per gli MP3.

Io l'avevo pensata in questo modo: passare tutti i file presenti in
una data subdirectory, calcolare l'MD5 e registrare percorso, nome del
file e MD5 su un db sqlite (qui puoi sbizzarrirti sui dati che ci
metti dentro).

Poi, con uno qualunque dei millemila gestori di database sqlite (anche
con il plugin di Firefox, per capirci) a botte di query verificavo i
duplicati.

Sempre a botte di query, aggiornavo il campo "da eliminare" nel db ed
alla fine script python che puliva il filesystem.

Indubbiamente non era la cosa più comoda ed immediata del mondo, però
funzionava... :)

Librerie utilizzate: MD5, sqlite, os.

PS: Scusate il quoting, ma 'sta interfaccia nuova di Gmail non l'ho
ancora digerita..

Ciao,
Simone


Maggiori informazioni sulla lista Python