[Python] BeautifulSoup e iterazioni (no find_all)
Giuseppe Amato
giuamato a gmail.com
Lun 29 Feb 2016 15:28:49 CET
Buongiorno lista,
Sto usando BeautifulSoup per estrarre un elenco di link da una pagina html.
Il codice che sto usando è il seguente:
soup = BeautifulSoup(html_doc, 'html.parser')
a=soup.find_all(href=re.compile("showthread"))
print a
Ottengo l'errore:
RuntimeError: maximum recursion depth exceeded while calling a Python object
Indagando un po' ho scoperto che il problema è dato dal fatto che i link
sono troppi, infatti facendo:
a=soup.find_all(href=re.compile("showthread"),limit=200)
non mi dà errore e si comporta come mi aspetto.
Nella documentazione di BeautifulSoup non sono riuscito a trovare un modo
per iterare elemento per elemento, avete qualche suggerimento?
*____________________________*
*Giuseppe Amato*
e-mail: giuamato a gmail.com
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20160229/2887360a/attachment.html>
Maggiori informazioni sulla lista
Python