<div class="gmail_quote">On 29 September 2010 16:17, Nicola Larosa <span dir="ltr"><<a href="mailto:nico@teknico.net">nico@teknico.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im">franco93it wrote:<br>
> Mi puoi fare un esempio di estrazione come devo fare io con lxml?<br>
<br>
</div>Ecco un paio d'esempi. Attenzione che usano entrambi XPath, che è una<br>
sintassi potente, ma non immediata, per identificare tag nei markup<br>
basati su XML:<br>
<br>
<a href="http://bytes.com/topic/python/answers/790508-parsing-html" target="_blank">http://bytes.com/topic/python/answers/790508-parsing-html</a><br>
<br>
<a href="http://blog.ianbicking.org/2007/09/24/lxmlhtml/" target="_blank">http://blog.ianbicking.org/2007/09/24/lxmlhtml/</a><br></blockquote><div><br><br>Piu' familiare:<br><br>In [4]: import lxml.html<br><br>In [5]: doc = lxml.html.parse('<a href="http://www.google.com">http://www.google.com</a>').getroot()<br>
<br>In [6]: for el in doc.cssselect('title'):<br> ...: print el.text_content()<br> ...: <br> ...: <br>Google<br></div></div><br><br>