<p dir="ltr">Ciao lista, </p>
<p dir="ltr">In casa mi sono fatto un Severino con Debian, come tutti sappiamo, quando si hanno a disposizione questo spazi si comincia a buttare dentro roba senza pensarci più di tanto.</p>
<p dir="ltr">Ora mi ritrovo con una marea di file duplicati, a volte anche con nomi diversi... ho privato diversi programmi che dovrebbero trovare tutti i duplicati, ma per un verso o per l'altro non mi hanno mai soddisfatto.</p>

<p dir="ltr">Visto che si tratta di un file server, quindi senza interfaccia, pensavo ad un qualcosa diviso in due parti... il motore vero e proprio e un'interfaccia web che permetta di esaminare il risultato dell'elaborazione, che per il modello di scansione e per la quantità di materiale potrebbe metterci anche qualche giorno. Per di più esaminare il risultato non è un'operazione immediata, ci potrebbero volere diverse sessioni di lavoro sulla pagina web. La cosa interessante sarebbe riuscire a far rimanere attivo il processo in background che analizzi i nuovi file inseriti nella directory considerata.</p>

<p dir="ltr">Va da se che per poter fare una cosa che sui prolunghi nel tempo bisogna costruire una struttura dati adeguata e avere un sistema di memorizzazione su una qualche forma di DB.</p>
<p dir="ltr">La struttura dati che ho pensato è relativamente banale, un dizionario in cui si usa una tupla come chiave e una lista come dato. La tupla conterrà i seguenti dati: <br>
 - la dimensione del file (banale stat)<br>
 - il tipo di file (il responso del comando file, o il corrispettivo python se esiste)<br>
 - il calcolo md5sum del file (questa è sicuramente la parte più onerosa in termini di tempo di calcolo)</p>
<p dir="ltr">Mentre la lista di dati è molto semplicemente l' elenco dei file che condividono gli elementi usati per generare la chiave.</p>
<p dir="ltr">Ora... se per la parte di scansione e generazione del dizionario, credo di non avere problemi, per la gestione del DB e della parte web non saprei proprio da che parte girarmi... per la gestione come deamon ci si può pensare successivamente.</p>

<p dir="ltr">Per il DB, mi avete distrutto il mito di maisequel, cosa mi consigliate? Postgress o SQLite?</p>
<p dir="ltr">Per la gestione del web? Implementare qualcosa con django?</p>
<p dir="ltr">Byez<br>
-- <br>
Gollum1<br>
tessssoro, dov'è il mio tessssoro...</p>