[Python] Estrarre stringa da stringa

Mer 29 Set 2010 16:26:50 CEST

Una soluzione con lxml:

from lxml import html

pagina = html.parse('http://www.google.it').getroot()
for item in pagina.cssselect('title'):
    print item.text

Come già detto è meglio non utilizzare le RegEx per fare il parsing html:
http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not

Il giorno 29 settembre 2010 16:04, franco93it <franco93it a gmail.com> ha
scritto:

> Il giorno 29 settembre 2010 15:56, Nicola Larosa <nico a teknico.net> ha
> scritto:
>
>> Ho avuto buoni risultati con lxml.html
>> (http://codespeak.net/lxml/lxmlhtml.html). lxml è una delle migliori
>> librerie XML per Python, ed lxml.html è un parser tollerante specifico
>> per l'HTML.
>
>
> Mi puoi fare un esempio di estrazione come devo fare io con lxml?
>
> _______________________________________________
> Python mailing list
> Python a lists.python.it
> http://lists.python.it/mailman/listinfo/python
>
>
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: http://lists.python.it/pipermail/python/attachments/20100929/cc3b3c5c/attachment.htm