diff --git a/src/new/TraduzSentencas.py b/src/new/TraduzSentencas.py index fc74f4c..1c3a018 100644 --- a/src/new/TraduzSentencas.py +++ b/src/new/TraduzSentencas.py @@ -43,7 +43,7 @@ class TraduzSentencas(Thread): sentenca_corrigida = self.aplic_regras.simplificar_sentenca(regras_aplicadas) sinonimos_aplicados = self.aplic_sinonimos.aplicar_sinonimos(sentenca_corrigida) - self.glosa = sinonimos_aplicados.encode('utf-8') + self.glosa = sinonimos_aplicados.upper().encode('utf-8') def obter_glosa(self): return self.glosa diff --git a/src/new/alexp.py b/src/new/alexp.py index 2d8d4a3..48ad882 100644 --- a/src/new/alexp.py +++ b/src/new/alexp.py @@ -45,7 +45,7 @@ def toqueniza(s): return AnotaCorpus.TOK_PORT.tokenize(decodificada) def getAnaliseMorfologica(): - return sentenca_anotada + return [list(x) for x in sentenca_anotada] def etiquetaSentenca(s): """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. @@ -55,7 +55,8 @@ def etiquetaSentenca(s): while (anotada[0][1] is None): time.sleep(random.choice(sleep_times)) anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] - return [[x[0].upper(), x[1]] for x in anotada] + anotada[0] = (anotada[0][0].lower(), anotada[0][1]) + return anotada def geraEntradasLexicais(lista): """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. -- libgit2 0.21.2