From f56fda5acd10b79bf72af42c6cea871293d7ad04 Mon Sep 17 00:00:00 2001 From: Erickson Silva Date: Thu, 26 Mar 2015 17:57:37 -0300 Subject: [PATCH] Modifica os tokens da lista da análise morfologica para minusculo --- src/new/TraduzSentencas.py | 2 +- src/new/alexp.py | 8 +++++--- 2 files changed, 6 insertions(+), 4 deletions(-) diff --git a/src/new/TraduzSentencas.py b/src/new/TraduzSentencas.py index 1c3a018..f5e1c86 100644 --- a/src/new/TraduzSentencas.py +++ b/src/new/TraduzSentencas.py @@ -35,7 +35,7 @@ class TraduzSentencas(Thread): analise_morfologica = alexp.getAnaliseMorfologica() if (isinstance(analise_sintatica,type(None))): - print "# ANÁLISE MORFÓLIGCA" + print "# ANÁLISE MORFOLÓGICA" regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) else: print "# ANÁLISE SINTÁTICA" diff --git a/src/new/alexp.py b/src/new/alexp.py index 48ad882..a3430ee 100644 --- a/src/new/alexp.py +++ b/src/new/alexp.py @@ -45,7 +45,8 @@ def toqueniza(s): return AnotaCorpus.TOK_PORT.tokenize(decodificada) def getAnaliseMorfologica(): - return [list(x) for x in sentenca_anotada] + return sentenca_anotada + #return [list(x) for x in sentenca_anotada] def etiquetaSentenca(s): """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. @@ -55,8 +56,9 @@ def etiquetaSentenca(s): while (anotada[0][1] is None): time.sleep(random.choice(sleep_times)) anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] - anotada[0] = (anotada[0][0].lower(), anotada[0][1]) - return anotada + #anotada[0] = (anotada[0][0].lower(), anotada[0][1]) + #return anotada + return [[x[0].lower(),x[1]] for x in anotada] def geraEntradasLexicais(lista): """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. -- libgit2 0.21.2