[Python] parsing pagina web

Valerio Maggio valerio.maggio a gmail.com
Mar 10 Set 2013 22:43:38 CEST


2013/9/10 Gollum1 <gollum1.smeagol1 a gmail.com>

>
> ora il mio problema è come faccio a prelevare il contenuto di questo tag?
>
> dentro ho una sequenza di tag <td>, i primi tag hanno dei contenuti
> che devo prelevare,
> i successivi tag <td> contengono un tag <input> che negli attributi
> contiene altri valori che mi servono.
>
> come faccio a legarli uno con l'altro? come posso vedere al suo interno?


Il punto è che fare /web scraping/ come serve a te diventa complicato con
un parser ad eventi SAX-like [1], come sembra essere HTMLParser.

Al contrario, è semplicissimo farlo con un parser DOM-based.

Dà una occhiata a BeautifulSoup [
http://www.crummy.com/software/BeautifulSoup/bs4/doc/], dovresti risolvere
!-)

--
[1]: http://en.wikipedia.org/wiki/Simple_API_for_XML
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20130910/c2f8023e/attachment.html>


Maggiori informazioni sulla lista Python