[Python] Recuperare ed elaborare i post in Wordpress per farne un libro

Karim lemieliste a gmail.com
Gio 18 Apr 2013 10:58:03 CEST


Ciao a tutti, scrivo per sapere se qualcuno di voi si è già imbattuto in
questa problematica o ha qualche consiglio da darmi.

Ho un blog con circa 700 articoli scritti durante i miei 5 anni di
residenza in Lituania, visto che ho toccato tutti gli argomenti vorrei
farne un libro.

Per recuperare i post ho visto che c'è un bel script:

http://python-wordpress-xmlrpc.readthedocs.org/en/latest/examples/posts.html

L'ho provato e funziona, ottengo gli articoli.

Ora il problema è pulirli dal codice html e collezionarli in modo che siano
pubblicabili in un PDF che andrà a finire in mano all'editore per una prima
analisi.

Per la pulizia del testo dall'html ho alcuni dubbi. In alcuni casi
utilizzavo la formattazione classica dell'html per dare enfasi al testo, a
volte includevo dei link e dei video youtube. Forse è meglio aggiungere i
link alla fine dell'articolo giusto per referenza?

Per creare il pdf potrei generare un documento latex. Pur conoscendo il
latex, non ho mai "automatizzato" il processo, voi sapete qualcosa a
proposito?

Fatto il PDF, devo usare tutti questi articoli per mandare a deambulare
Wordpress e passare a Django, ma questa è un'altra storia...

Vi ringrazio.

Ciao
-- 
Karim Gorjux
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20130418/f2044bc4/attachment.html>


Maggiori informazioni sulla lista Python