[Python] Proof of concept per un programma di scansione duplicati.

Gollum1 gollum1.smeagol1 a gmail.com
Ven 21 Giu 2013 22:37:16 CEST


Il 21 giugno 2013 22:20, Enrico Bianchi <enrico.bianchi a ymail.com> ha scritto:
> On 06/20/2013 08:43 PM, Marco Beri wrote:
>>
>> Io credo che, al tuo posto, guarderei solo le dimensioni e l'md5 per
>> quelle uguali.
>
>
> Non solo, per un lavoro del genere e` meglio affidarsi a:
>
>  - Dimensione;
>  - Creation time;
>  - Modification time;
>  - MD5.
>

sì, avevo pensato anche io di memorizzare qualcosa del genere, in
considerazione del fatto di fare scansioni successive... ricalcolare
tutti gli md5 sarebbe stupido, quindi posso memorizzare il time al
momento della scansione e alla prossima scansione, se non è cambiato,
lo salto nella scansione.

mi pare però che ci sia qualche problema con il modification time...
in linux (per alcuni fs, tipo ext1-2-3-4) non viene gestito il
modification time... (ora sinceramente non ricordo di preciso come è
la situazione)...

però è fattibile...


> (in caso affermativo, potrei pensare anche di fare degli hard
> link).

Non ho capito questo passo dell'hard link...

> Un processo del genere lo uso per verificare i file che devo porre
> sotto backup (in teoria uso solo l'MD5, ma comunque mi salvo anche questi
> dettagli)

Mi tengo sott'occhio anche questa mail, appena torno dalle ferie ed ho
finito un altro progetto a cui sto lavorando, riprenderò in mano tutto
questo thread e vi terrò informati sugli sviluppi...

Byez
--
Gollum1
Tesssssoro, dov'é il mio tessssoro...


Maggiori informazioni sulla lista Python