[Python] Recuperare ed elaborare i post in Wordpress per farne un libro
Manlio Perillo
manlio.perillo a gmail.com
Gio 18 Apr 2013 11:38:03 CEST
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Il 18/04/2013 11:22, Nicola Larosa ha scritto:
> Karim wrote:
>> Ora il problema è pulirli dal codice html e collezionarli in modo che
>> siano pubblicabili in un PDF che andrà a finire in mano all'editore
>> per una prima analisi.
>> [...]
>> Per creare il pdf potrei generare un documento latex. Pur conoscendo
>> il latex, non ho mai "automatizzato" il processo, voi sapete qualcosa
>> a proposito?
>
> Al tuo posto non userei LaTEX (né docbook), ma docutils e
> ReStructuredText <http://docutils.sourceforge.net/>, magari con
> l'aggiunta di Sphinx <http://sphinx-doc.org/>.
>
Il problema è che lui non deve solo convertire, ma poi analizzare e
trasformare, in modo da ripulire il testo.
LaTeX e ReStructuredText non sono dei formati che raccomanderei per
questo tipo di compito; sono relativamente facili da scrivere, ma
complessi da gestire in modo automatico.
> [...]
Ciao Manlio
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org/
iEYEARECAAYFAlFvvvsACgkQscQJ24LbaUTmqgCfYYtJ2fRJEF1trz1oPiZw+pwp
hBUAnj4Zp15EweJW3CDjcr/xt0y35u42
=tgLr
-----END PGP SIGNATURE-----
Maggiori informazioni sulla lista
Python