[Python] Proof of concept per un programma di scansione duplicati.

Marco Beri marcoberi a gmail.com
Gio 20 Giu 2013 20:43:32 CEST


Il giorno 20/giu/2013 20:03, "Gollum1" <gollum1.smeagol1 a gmail.com> ha
scritto:
>
> Il giorno 20/giu/2013 19:49, "Marco Beri" <marcoberi a gmail.com> ha
scritto:
>
> > Uhm... io guarderei solo la dimensione. Altrimenti può esserci un
readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono.
> >
> > Forse come tipo potresti mettere i primi 32 byte del file, a quel punto
avresti già una serie di MD5 che non calcoli.
>
> Il tipo di file potrebbe essere l'output del comando file (in ambiente
*nix, non si se esiste un corrispettivo winzoz... se ci fosse un modulo
python che restituisce i "magic number" sarebbe ottimo)
>
> Quindi per il tipo di file non penso assolutamente di basarmi sulle
estensioni degli stessi.

Uhm... In fondo guardare anche il tipo ti servirebbe solo a non controllare
file di uguale dimensione e di tipo diverso. Evento abbastanza raro in
fondo.

Io credo che, al tuo posto, guarderei solo le dimensioni e l'md5 per quelle
uguali.

Ciao.
Marco.
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20130620/9646ebe8/attachment.html>


Maggiori informazioni sulla lista Python