[Python] solr e hystack

Strap Lab lab a strap.it
Sab 12 Gen 2019 12:56:08 CET


Ciao

Il giorno sab 12 gen 2019, 11:49 salvatore monaco <
salvatore.monaco a gmail.com> ha scritto:

> Ciao Francesco,
> io in condizioni analoghe uso tika
> https://tika.apache.org/
>

Dovrebbe già essere integrato in solr, quindi il metodo suggerito con
haystack dovrebbe funzionare senza particolari sforzi, almeno così mi
sembra di capire dalla documentazione e dal codice Python.
Non avendo mai utilizzato solr lascio comunque la parola ai più esperti.

Ad ogni modo l'estrazione di testo da pdf si può fare anche con Python, ci
sono un paio di packages interessanti: pdfminer e pdf2 toolkit.

Sani
Strap

PS: evitiamo il top quoting, giusto? ;-)
-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://lists.python.it/pipermail/python/attachments/20190112/0098d592/attachment.html>


Maggiori informazioni sulla lista Python