[Python] Proof of concept per un programma di scansione duplicati.

Marco Beri marcoberi a gmail.com
Gio 20 Giu 2013 19:48:34 CEST


2013/6/20 Gollum1 <gollum1.smeagol1 a gmail.com>

> Ecco... questo è un concetto da estendere... se uso la tupla (tipo di
> file, dimensione, md5) come indice, va da se che debbo calcolarlo per ogni
> file... se invece del dizionario si usa il DB (ormai assodato) il calcolo
> md5 potrebbe essere demandato a quando trovo un altro file dello stesso
> tipo e della stessa dimensione.
>
Uhm... io guarderei solo la dimensione. Altrimenti può esserci un
readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono.

Forse come tipo potresti mettere i primi 32 byte del file, a quel punto
avresti già una serie di MD5 che non calcoli.

Ciao.
Marco.

-- 
http://beri.it/ - Un blog
http://beri.it/i-miei-libri/ - Qualche libro
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20130620/24c727bc/attachment.html>


Maggiori informazioni sulla lista Python