[Python] espressioni regolari

Andrea Spadaccini a.spadaccini a catania.linux.it
Lun 23 Apr 2012 16:41:58 CEST


Ciao,

[cut]

> result = re.sub(r"(?m)(>\n+|\t|\r|\s+\?<)|(<!--.*?-->)", "", text)

Ecco cosa potrebbe accadere se fai il parsing di documenti HTML con le regex:
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454

:)

Andrea


Maggiori informazioni sulla lista Python