[Python] Domanda facile facile su caso manipolazione unicode

Marco Ippolito ippolito.marco a gmail.com
Gio 29 Gen 2015 08:50:53 CET


Mille grazie a tutti per gli spunti di soluzione che mi avete dato.
Li provo uno ad uno.

Ho provato ora questa:

    def remove_accent(self, input_str):
        nfkd_form = unicodedata.normalize('NFKD', unicode(input_str))

        return u"".join([ch for ch in nkfd_form if not
unicodedata.combining(c)])
self.extracted_text_u = self.remove_accent(self.extracted_text_u)

  File "extract_sentences.py", line 34, in remove_accent
    nfkd_form = unicodedata.normalize('NFKD', unicode(input_str))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position
16: ordinal not in range(128)


Maggiori informazioni sulla lista Python