[Python] Algoritmo in CSV

Daniele Varrazzo piro a develer.com
Gio 2 Set 2010 15:22:56 CEST


On Thu, 2 Sep 2010 14:41:10 +0200, "Vittorio Zuccala'"
<vittorio.zuccala a gmail.com> wrote:
> Buongiorno,
> chiedo consiglio su un algoritmo da usare che sia veloce.
> Anche solo in meta-codice.
> 
> Problema:
> - carico un CSV con 200 colonne e 2 milioni di righe
> - voglio trovare la lunghezza maggiore per ogni campo

> Ecco: il mio problema è che vengono effettuati 200*2.000.000 di IF e la
> cosa
> non mi piace molto.

La definizione del tuo problema richiede questo. Puoi trovare un idioma
per abbassare qualche costante moltiplicativa, ma devi sempre fare 200*2M
di confronti.

> Qualcuno ha un consiglio per ottimizzare?

Ridefinisci il problema. Vedi se puoi lavorare con un'approssimazione del
valore. Analizza solo i primi 1K record o se il file è seekabile pesca a
caso qualche centinaio di record.

-- 
Daniele Varrazzo - Develer S.r.l. 
http://www.develer.com


Maggiori informazioni sulla lista Python