Commit f56fda5acd10b79bf72af42c6cea871293d7ad04
1 parent
f86e2770
Exists in
master
and in
1 other branch
Modifica os tokens da lista da análise morfologica para minusculo
Showing
2 changed files
with
6 additions
and
4 deletions
Show diff stats
src/new/TraduzSentencas.py
... | ... | @@ -35,7 +35,7 @@ class TraduzSentencas(Thread): |
35 | 35 | analise_morfologica = alexp.getAnaliseMorfologica() |
36 | 36 | |
37 | 37 | if (isinstance(analise_sintatica,type(None))): |
38 | - print "# ANÁLISE MORFÓLIGCA" | |
38 | + print "# ANÁLISE MORFOLÓGICA" | |
39 | 39 | regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) |
40 | 40 | else: |
41 | 41 | print "# ANÁLISE SINTÁTICA" | ... | ... |
src/new/alexp.py
... | ... | @@ -45,7 +45,8 @@ def toqueniza(s): |
45 | 45 | return AnotaCorpus.TOK_PORT.tokenize(decodificada) |
46 | 46 | |
47 | 47 | def getAnaliseMorfologica(): |
48 | - return [list(x) for x in sentenca_anotada] | |
48 | + return sentenca_anotada | |
49 | + #return [list(x) for x in sentenca_anotada] | |
49 | 50 | |
50 | 51 | def etiquetaSentenca(s): |
51 | 52 | """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. |
... | ... | @@ -55,8 +56,9 @@ def etiquetaSentenca(s): |
55 | 56 | while (anotada[0][1] is None): |
56 | 57 | time.sleep(random.choice(sleep_times)) |
57 | 58 | anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] |
58 | - anotada[0] = (anotada[0][0].lower(), anotada[0][1]) | |
59 | - return anotada | |
59 | + #anotada[0] = (anotada[0][0].lower(), anotada[0][1]) | |
60 | + #return anotada | |
61 | + return [[x[0].lower(),x[1]] for x in anotada] | |
60 | 62 | |
61 | 63 | def geraEntradasLexicais(lista): |
62 | 64 | """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. | ... | ... |