[Python] Estrarre stringa da stringa

Marco Beri marcoberi a gmail.com
Mer 29 Set 2010 15:48:44 CEST


2010/9/29 franco93it <franco93it a gmail.com>

> Salve.
> Scarico il sorgente di una pagina web in questo modo:
>
> import urllib
> sock = urllib.urlopen("http://www.sito.ext/pagina.ext")
> sorgente = sock.read()
> sock.close()
>
>
import re
r = re.compile('(<!--.*?-->)|(<[^>]*>)|([^<]+)', re.DOTALL)
for x, y, z in r.findall(sorgente):
     if z.strip():
       print z.replace("&nbsp;", " ")

Ciao.
Marco.

-- 
http://thinkcode.tv/gratis - Capire in 15 minuti cosa pu fare Python
http://stacktrace.it - Aperiodico di resistenza informatica
http://python.thinkcode.tv - Videocorso di Python
http://beri.it - Blog di una testina di vitello
-------------- parte successiva --------------
Un allegato HTML  stato rimosso...
URL: http://lists.python.it/pipermail/python/attachments/20100929/58e5b257/attachment.htm 


Maggiori informazioni sulla lista Python