<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body>
Ciao a tutti, 
<div><br>
</div>
<div>sono nuovo della mailing list e mi scuso in anticipo se violo qualche norma della netiquette l :)</div>
<div><br>
</div>
<div>Scrapy è un ottimo modulo per lo scaping, specie perchè implementa nativamente la ricerca mediante XPATH, anche ricorsiva e ramificata, all'interno del codice html prelevato.</div>
<div>La documentazione è buona ma dovrai smanettarci un poco perchè pecca in alcuni punti.</div>
<div><br>
</div>
<div>Fabio Toscano</div>
<div><br>
</div>
<br>
<br>
-------- Messaggio originale --------<br>
Da: Davide Muzzarelli <d.muzzarelli@dav-muz.net><br>
Data:17/06/2015 11:51 (GMT+01:00) <br>
A: python@lists.python.it <br>
Oggetto: Re: [Python] Consiglio per l' implementazione <br>
<br>
<div class="BodyFragment">
<div class="PlainText">Il 17/06/2015 11:35, Matteo Scarpa ha scritto:<br>
> Il lato server che fa il parsing lo farei in python perché lavora meglio<br>
> del Java con i file html ma oltre a Beautifullsoup non conosco moduli<br>
> per questo genere di cose. Ci sono alternative migliori? Sto sbagliando<br>
> tutto? Esiste un modulo python che fa il parsing e lo esporta<br>
> direttamente in json?<br>
<br>
Ciao Matteo,<br>
puoi usare Scrapy ed esportare in JSON o in qualsiasi altro formato.<br>
<br>
<a href="http://scrapy.org/">http://scrapy.org/</a><br>
<br>
Fare lo scraping più richiedere diversi minuti, a seconda delle <br>
condizioni della rete, dei tempi di risposta e del numero di pagine da <br>
scaricare.<br>
A meno che tu non debba scaricare i dati da poche semplici pagine, <br>
conviene che questa operazione venga fatta in maniera asincrona. A fine <br>
scraping devi quindi avvisare l'app che i dati sono pronti.<br>
<br>
Davide Muzzarelli<br>
_______________________________________________<br>
Python mailing list<br>
Python@lists.python.it<br>
<a href="http://lists.python.it/mailman/listinfo/python">http://lists.python.it/mailman/listinfo/python</a><br>
</div>
</div>
</body>
</html>