Commit b648677136fb39b4ac9c6c6ef9192c9a2dff3d44

Authored by Erickson Silva
1 parent 5d7f200d
Exists in master and in 1 other branch devel

Corrige substituição de travessão

Showing 1 changed file with 1 additions and 1 deletions   Show diff stats
@@ -41,7 +41,7 @@ def toqueniza(s): @@ -41,7 +41,7 @@ def toqueniza(s):
41 """Decodifica string utilizando utf-8, retornando uma lista de tokens em unicode. 41 """Decodifica string utilizando utf-8, retornando uma lista de tokens em unicode.
42 """ 42 """
43 regex = re.compile('[%s]' % re.escape('“”')) 43 regex = re.compile('[%s]' % re.escape('“”'))
44 - decodificada=regex.sub('-',s.replace("–", "-")).decode("utf-8") 44 + decodificada=regex.sub('"',s.replace("–", "-").replace("—", "-")).decode("utf-8")
45 return AnotaCorpus.TOK_PORT.tokenize(decodificada) 45 return AnotaCorpus.TOK_PORT.tokenize(decodificada)
46 46
47 def getAnaliseMorfologica(): 47 def getAnaliseMorfologica():