[Python] Recuperare ed elaborare i post in Wordpress per farne un libro

Nicola Larosa nico a tekNico.net
Gio 18 Apr 2013 11:22:26 CEST


Karim wrote:
> Ora il problema è pulirli dal codice html e collezionarli in modo che 
> siano pubblicabili in un PDF che andrà a finire in mano all'editore
> per una prima analisi.
> [...]
> Per creare il pdf potrei generare un documento latex. Pur conoscendo
> il latex, non ho mai "automatizzato" il processo, voi sapete qualcosa
> a proposito?

Al tuo posto non userei LaTEX (né docbook), ma docutils e
ReStructuredText <http://docutils.sourceforge.net/>, magari con
l'aggiunta di Sphinx <http://sphinx-doc.org/>.

Per convertire da HTML a ReST puoi usare html2rest
<https://pypi.python.org/pypi/html2rest>.

Oppure, sia che usi ReST sia che no, puoi dare un'occhiata a Pandoc
<http://johnmacfarlane.net/pandoc/>, un convertitore tra vari tipi di markup.


> Fatto il PDF, devo usare tutti questi articoli per mandare a
> deambulare Wordpress e passare a Django, ma questa è un'altra
> storia...

Una volta che hai i documenti in ReST, ci sono parecchi strumenti per
usarli in Django, a seconda della base di applicazioni da cui parti.

-- 
Nicola Larosa - http://www.tekNico.net/

Another poster said on the [Go] mailing list: "The problem you run
into is that once you add a feature, you can never take it back." I
totally subscribe to that. I want metaprogramming, it is so incredibly
convenient, but it has to be fully in-line with Go's strengths.
We can leave half-assed crap for PHP. - Jörg Walter, June 2011


Maggiori informazioni sulla lista Python