[Python] Proof of concept per un programma di scansione duplicati.
Manlio Perillo
manlio.perillo a gmail.com
Gio 20 Giu 2013 20:22:03 CEST
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Il 20/06/2013 19:48, Marco Beri ha scritto:
> 2013/6/20 Gollum1 <gollum1.smeagol1 a gmail.com
> <mailto:gollum1.smeagol1 a gmail.com>>
>
> Ecco... questo è un concetto da estendere... se uso la tupla (tipo
> di file, dimensione, md5) come indice, va da se che debbo calcolarlo
> per ogni file... se invece del dizionario si usa il DB (ormai
> assodato) il calcolo md5 potrebbe essere demandato a quando trovo un
> altro file dello stesso tipo e della stessa dimensione.
>
> Uhm... io guarderei solo la dimensione. Altrimenti può esserci un
> readme.rst e un leggimi.txt che sono uguali ma che ti sfuggono.
>
Se sono uguali è probabile che uno sia un link ad un altro.
Se due file hanno un inode diverso sullo stesso filesystem, io
calcolerei l'hash per entrambi, senza controllare la dimensione.
> [...]
Ciao Manlio
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
iEYEARECAAYFAlHDSEsACgkQscQJ24LbaUSCuACffEP/amSSVOrFEvJjNlST1OMQ
yg0AoJUn+eosBdNojxZ55NiypkSra85Q
=mFVE
-----END PGP SIGNATURE-----
Maggiori informazioni sulla lista
Python