[Python] Estrarre stringa da stringa

Alessandro Dentella sandro a e-den.it
Mer 29 Set 2010 16:57:48 CEST


On Wed, Sep 29, 2010 at 02:37:28PM +0200, franco93it wrote:
> Salve.
> Scarico il sorgente di una pagina web in questo modo:
> 
> 
>     import urllib
>     sock = urllib.urlopen("http://www.sito.ext/pagina.ext")
>     sorgente = sock.read()
>     sock.close()
> 
> 
> Ora ho la stringa sorgente con il contenuto della pagina.
> Come faccio ad estrarre dalla pagina determinate parti contenuti fra tag noti?
> Per esempio se nella stringa c'  <title>titolo</title> come faccio ad ottenere
> titolo?

io trovo che pyquery sia il modo pił semplice di risolvere il parsing di
pagine html.

In [1]: from pyquery import PyQuery
In [2]: d = PyQuery(url='http://pypi.python.org/pypi/pyquery')
In [3]: title = d('title')[0]
In [4]: title.text
Out[4]: 'Python Package Index : pyquery 0.6.1'

sandro
*:-)


-- 
Sandro Dentella  *:-)
http://www.reteisi.org             Soluzioni libere per le scuole
http://sqlkit.argolinux.org        SQLkit home page - PyGTK/python/sqlalchemy


Maggiori informazioni sulla lista Python