[Python] gestione della memoria

Giovanni Marco Dall'Olio dalloliogm a gmail.com
Mer 6 Giu 2012 16:29:43 CEST


2012/6/6 Lorenzo Bottai <bottai a lamma.rete.toscana.it>

> Ho un problema sulla gestione di matrici di grandi dimensioni. In
> particolare il programma va in errore a gestire 4 immagini 7000 x 7000 di
> tipo float.
>

Puoi dare una occhiata alla libreria hdf5 per python:
- http://alfven.org/wp/hdf5-for-python/

HDF5 è un formato usato in fisica per gestire dati di grosse dimensioni.
Per esempio, risultati di simulazioni, accelerazioni di particelle,
osservazioni di telescopi. Credo che sia utilizzato anche in altri campi,
come per esempio per le previsioni meteo ed altro.

In principio, ogni file binario HDF5 è un piccolo file system a parte, con
gruppi (directory) e datasets. Dovresti essere in grado di leggere il tuo
dataset su un file HDF5 e lavorare su esso direttamente, senza doverlo
caricare in memoria.

La documentazione è molto buona e l'oggetto utilizzato per rappresentare
una matrice è simile ad un array di numpy, addirittura alcuni metodi sono
in comune e con un po' di fortuna le funzioni che utilizzi non si
renderanno nemmeno conto della differenza.



-- 
Giovanni Dall'Olio, phd student
IBE, Institut de Biologia Evolutiva, CEXS-UPF (Barcelona, Spain)

My blog on bioinformatics: http://bioinfoblog.it
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20120606/f80833ea/attachment.html>


Maggiori informazioni sulla lista Python