<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">2015-07-09 19:20 GMT+02:00 Matteo Scarpa <span dir="ltr"><<a href="mailto:matteoscarpa92@gmail.com" target="_blank">matteoscarpa92@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Volevo ringraziarvi per il suggerimento datomi nella mia precedente mail. Grazie al vostro consiglio io ora uso Scrapy per il parsing e riesco a fare il parsing, elaborazione, pulizia e inserimento nel db di 128 pagine in 30 secondi, cosa prima impensabile.<br>
<br>
Ora invece ho un altro problema: devo confrontare due stringhe di grosse dimensioni su due programmi differenti (server python e app in java) e dire se sono uguali. Per fare ció ho copiato il metodo di confronto di Git: produco una stringa SHA-1 sia su python che su java e le confronto.</blockquote><div><br></div><div>Nota importante: Git usa l'hashing perchè gli oggetti che gestisce sono *immutabili*.</div><div><br></div><div>Se devi confrontare due stringhe che cambiano di volta in volta, usare l'hashing potrebbe non essere la soluzione migliore.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"> Questo mi permette di avere i messaggi inviati dall'applicazione decisamente piú piccoli rispetto all'invio dell'intero testo. </blockquote><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"> Peró mi sorge un dubbio: dando per scontato che entrambe le implementazioni del SHA-1 siano corette le due stringhe dovrebbero essere uguali o devo comunque controllare che usino la stessa codifica (tipo entrambe in ASCII)?</blockquote><div><br></div><div>Che intendi?</div><div>SHA-1, come tutte le funzioni di hashing, vede solo raw bytes.</div><div><br></div><div>Se gli hash di due stringhe sono uguali, hai una probabilità molto alta (che dipende dal numeri di bits dell'hash generato) che anche le due stringhe sono uguali.</div><div>Per informazioni più precise:</div><div><a href="https://en.wikipedia.org/wiki/Cryptographic_hash_function">https://en.wikipedia.org/wiki/Cryptographic_hash_function</a><br></div><div><br></div><div><br></div><div>Ciao  Manlio </div></div></div></div>