[Python] Proof of concept per un programma di scansione duplicati.

Manlio Perillo manlio.perillo a gmail.com
Gio 20 Giu 2013 20:22:03 CEST


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Il 20/06/2013 19:48, Marco Beri ha scritto:
> 2013/6/20 Gollum1 <gollum1.smeagol1 a gmail.com
> <mailto:gollum1.smeagol1 a gmail.com>>
> 
>     Ecco... questo è un concetto da estendere... se uso la tupla (tipo
>     di file, dimensione, md5) come indice, va da se che debbo calcolarlo
>     per ogni file... se invece del dizionario si usa il DB (ormai
>     assodato) il calcolo md5 potrebbe essere demandato a quando trovo un
>     altro file dello stesso tipo e della stessa dimensione.
> 
> Uhm... io guarderei solo la dimensione. Altrimenti può esserci un
> readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono.
> 

Se sono uguali è probabile che uno sia un link ad un altro.
Se due file hanno un inode diverso sullo stesso filesystem, io
calcolerei l'hash per entrambi, senza controllare la dimensione.

> [...]


Ciao  Manlio
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/

iEYEARECAAYFAlHDSEsACgkQscQJ24LbaUSCuACffEP/amSSVOrFEvJjNlST1OMQ
yg0AoJUn+eosBdNojxZ55NiypkSra85Q
=mFVE
-----END PGP SIGNATURE-----


Maggiori informazioni sulla lista Python