Commit b648677136fb39b4ac9c6c6ef9192c9a2dff3d44
1 parent
5d7f200d
Exists in
master
and in
1 other branch
Corrige substituição de travessão
Showing
1 changed file
with
1 additions
and
1 deletions
Show diff stats
src/alexp.py
... | ... | @@ -41,7 +41,7 @@ def toqueniza(s): |
41 | 41 | """Decodifica string utilizando utf-8, retornando uma lista de tokens em unicode. |
42 | 42 | """ |
43 | 43 | regex = re.compile('[%s]' % re.escape('“”')) |
44 | - decodificada=regex.sub('-',s.replace("–", "-")).decode("utf-8") | |
44 | + decodificada=regex.sub('"',s.replace("–", "-").replace("—", "-")).decode("utf-8") | |
45 | 45 | return AnotaCorpus.TOK_PORT.tokenize(decodificada) |
46 | 46 | |
47 | 47 | def getAnaliseMorfologica(): | ... | ... |