[Python] espressioni regolari
Simone Federici
s.federici a gmail.com
Lun 23 Apr 2012 15:49:27 CEST
2012/4/23 Lorenzo Macchiavelli <lmacchiavelli a gmail.com>
> Ciao a tutti,
>
> sto cercando di realizzare un piccolo script che apre tutti i file del cms
> (centinaia, lavoro devastante )
> che uso in azienda e pulisce gli spazi tra i tag, tabulazioni ,ritorni a
> capo e commenti!
> tutto funzionante!... tranne la cosa essenziale!!... l'espressione
> regolare che elimina gli spazi :) !
> premettendo che sono pochi giorni che ho iniziato ad utilizzarle!
>
> result = re.sub(r"(?m)(>\n+|\t|\r|\s+\?<)|(<!--.*?-->)", "", text)
>
> praticamente con questa sovrascrivo anche i simboli(< >), come faccio a
> ad evitare che prenda anche il primo carattere del gruppo di ricerca?..
>
io userei beautifulsoup e cancellerei cosi i commenti
http://stackoverflow.com/questions/3507283/how-can-i-strip-comment-tags-from-html-using-beautifulsoup
le espressioni regolari fanno a cazzotti con html
S
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20120423/537e0a7d/attachment.html>
Maggiori informazioni sulla lista
Python