[Python] parsing pagina web
Valerio Maggio
valerio.maggio a gmail.com
Mar 10 Set 2013 22:43:38 CEST
2013/9/10 Gollum1 <gollum1.smeagol1 a gmail.com>
>
> ora il mio problema è come faccio a prelevare il contenuto di questo tag?
>
> dentro ho una sequenza di tag <td>, i primi tag hanno dei contenuti
> che devo prelevare,
> i successivi tag <td> contengono un tag <input> che negli attributi
> contiene altri valori che mi servono.
>
> come faccio a legarli uno con l'altro? come posso vedere al suo interno?
Il punto è che fare /web scraping/ come serve a te diventa complicato con
un parser ad eventi SAX-like [1], come sembra essere HTMLParser.
Al contrario, è semplicissimo farlo con un parser DOM-based.
Dà una occhiata a BeautifulSoup [
http://www.crummy.com/software/BeautifulSoup/bs4/doc/], dovresti risolvere
!-)
--
[1]: http://en.wikipedia.org/wiki/Simple_API_for_XML
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20130910/c2f8023e/attachment.html>
Maggiori informazioni sulla lista
Python