diff --git a/src/ClassificaSentencas.py b/src/ClassificaSentencas.py index 5d11232..bc43707 100644 --- a/src/ClassificaSentencas.py +++ b/src/ClassificaSentencas.py @@ -44,7 +44,7 @@ class ClassificaSentencas(object): """Decodifica string utilizando utf-8, retornando uma lista de tokens em unicode. """ try: - decodificada = s.translate(None, "“”«»’‘º").decode("utf-8") + decodificada = s.translate(None, "“”«»–’‘º").decode("utf-8") except UnicodeDecodeError: decodificada = s.replace("“","").replace("”","").replace("«","").replace("»","").replace("’","").replace("‘","").replace("º","").decode("utf-8") except: -- libgit2 0.21.2