<br><br><div class="gmail_quote">Il giorno 31 maggio 2012 22:49, Diego Barrera <span dir="ltr"><<a href="mailto:diegonebarrera@yahoo.it" target="_blank">diegonebarrera@yahoo.it</a>></span> ha scritto:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Io ho risolto in questo modo:<br>
-prendo ciascun campo e mi ricavo lo slug;<br>
-trovo la sottostringa massima comune degli slug che sto confrontando, per ciascun campo;<br>
-a questo punto se il valore percentuale della sottostringa rispetto allo slug supera per ciascun campo una soglia minima stabilita, i due destinatari sono lo stesso destinatario<br></blockquote><div><br>invece che la sottostringa di lunghezza massima potresti prendere la distanza di Levenshtein fra le due stringhe:<br>
<br><a href="http://en.wikipedia.org/wiki/Levenshtein_distance">http://en.wikipedia.org/wiki/Levenshtein_distance</a><br><br>puoi valutare se nel tuo caso sia pił significativa.<br><br>Puoi implementarti l'algoritmo o usare uno di quelli gią disponibili<br>
Googlando ho trovato i seguenti (che non ho verificato):<br><br><a href="http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Levenshtein_distance#Python">http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Levenshtein_distance#Python</a><br>
<br><a href="http://code.activestate.com/recipes/576874-levenshtein-distance/">http://code.activestate.com/recipes/576874-levenshtein-distance/</a><br><br>Marco<br></div></div>