<div dir="ltr">Posso suggerirti <a href="https://scrapy.org/">https://scrapy.org/</a> per il parsing di un gran numero di pagine? Ha tutto integrata la gestione del "multitreding" e permette di elaborare i risultati con beautifullsoup... Personalmente ho fatto di quelle porcate con questo framework/libreria e ora non vado nemmeno più a guardare quelle pagine ma leggo direttamente i risultati di scrapy</div><br><div class="gmail_quote"><div dir="ltr">Il giorno lun 10 lug 2017 alle ore 09:08 Nicola Larosa <<a href="mailto:nico@teknico.net">nico@teknico.net</a>> ha scritto:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Lorenzo Mainardi wrote:<br>

> Sto cercando di fare un po' di scraping con BeautifulSoup e devo<br>

> scaricare quasi 10000 pagine.<br>

> Avevo iniziato con requests, ma i tempi diventano bibilici lavorando<br>

> in modo sincrono. Allora ho fatto i seguenti test:<br>

><br>

> * twisted: non mi va di metterlo nel mezzo. Inoltre, avendoci lavorato<br>

> diversi anni fa lo considero troppo complesso per quello che devo<br>

> fare io<br>

<br>

Tornado: a gentler, kinder Twisted.<br>

<<a href="http://www.tornadoweb.org/en/stable/guide/async.html" rel="noreferrer" target="_blank">http://www.tornadoweb.org/en/stable/guide/async.html</a>><br>

<br>

Funziona una bellezza.<br>

<br>

--<br>

Nicola 'tekNico' Larosa <<a href="https://www.tekNico.net/" rel="noreferrer" target="_blank">https://www.tekNico.net/</a>><br>

_______________________________________________<br>

Python mailing list<br>

<a href="mailto:Python@lists.python.it" target="_blank">Python@lists.python.it</a><br>

<a href="http://lists.python.it/mailman/listinfo/python" rel="noreferrer" target="_blank">http://lists.python.it/mailman/listinfo/python</a><br>

</blockquote></div><div dir="ltr">-- <br></div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><p dir="ltr">Fundor333<br>

<a href="https://fundor333.com">https://fundor333.com</a></p>

</div></div>