[Python] parsing pagina web
Gollum1
gollum1.smeagol1 a gmail.com
Mar 10 Set 2013 17:26:11 CEST
Ciao []
ritornando finelmante al mio "malsano progetto", sto cercando di fare
il parser della pagina web che ho scaricato.
usando python3, uso html.parser come modulo per fare il parsing.
from html.parser import HTMLParser
class TimeTableHTMLParser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
def handle_starttag(self, tag, attrs):
if tag == "tr":
for x,y in attrs:
if x.lower()=="class" and y.lower()=="testo2":
print("Ho individuato il campo del giorno")
oa il mio problema è come faccio a prelevare il contenuto di questo tag?
dentro ho una sequenza di tag <td>, i primi tag hanno dei contenuti
che devo prelevare,
i successivi tag <td> contengono un tag <input> che negli attributi
contiene altri valori che mi servono.
come faccio a legarli uno con l'altro? come posso vedere al suo interno?
se faccio hendle_data(data), mi vedo passare i dati contenuti in TUTTI
i tag della pagina, non solo quelli di cui ho bisogno... come posso
fare a discriminare quelli su cui devo lavorare?
Tnx
Byez
--
Gollum1
Tesssssoro, dov'é il mio tessssoro...
Maggiori informazioni sulla lista
Python