[Python] Algoritmo in CSV
Andrea Ambu
andreambu a gmail.com
Ven 3 Set 2010 17:52:23 CEST
2010/9/3 Giuseppe Amato <giuamato a gmail.com>:
> Ti conviene ordinare e prendere l'ultimo per ogni colonna utlizzando
> sort(cmp) sulle colonne. L'algoritmo di sort è già ottimizzato rispetto
> ai confronti che hai previsto tu. Se hai bisogno anche dell'indice del
> campo butti tutto in un dizionario del tipo {<campo>:<indice>} però devi
> fare attenzione alle duplicazioni, che comunque dovrai gestire nella
> ricerca del massimo
>
Se e` un CVS molto probabilmente quei dati hanno senso messi in riga,
inoltre riordinare (in python con timsort l'operazione e` O(log(n!))
quindi in questo caso righe*log(colonne!) e` molto piu` oneroso di
righe*colonne quando righe = 2 milioni e colonne = 200, ci sono 9
ordini di grandezza di mezzo.
--
Andrea
Maggiori informazioni sulla lista
Python