[Python] Estrarre stringa da stringa
Marco Beri
marcoberi a gmail.com
Mer 29 Set 2010 15:48:44 CEST
2010/9/29 franco93it <franco93it a gmail.com>
> Salve.
> Scarico il sorgente di una pagina web in questo modo:
>
> import urllib
> sock = urllib.urlopen("http://www.sito.ext/pagina.ext")
> sorgente = sock.read()
> sock.close()
>
>
import re
r = re.compile('(<!--.*?-->)|(<[^>]*>)|([^<]+)', re.DOTALL)
for x, y, z in r.findall(sorgente):
if z.strip():
print z.replace(" ", " ")
Ciao.
Marco.
--
http://thinkcode.tv/gratis - Capire in 15 minuti cosa puņ fare Python
http://stacktrace.it - Aperiodico di resistenza informatica
http://python.thinkcode.tv - Videocorso di Python
http://beri.it - Blog di una testina di vitello
-------------- parte successiva --------------
Un allegato HTML č stato rimosso...
URL: http://lists.python.it/pipermail/python/attachments/20100929/58e5b257/attachment.htm
Maggiori informazioni sulla lista
Python