Commit f56fda5acd10b79bf72af42c6cea871293d7ad04

Authored by Erickson Silva
1 parent f86e2770
Exists in master and in 1 other branch devel

Modifica os tokens da lista da análise morfologica para minusculo

Showing 2 changed files with 6 additions and 4 deletions   Show diff stats
src/new/TraduzSentencas.py
@@ -35,7 +35,7 @@ class TraduzSentencas(Thread): @@ -35,7 +35,7 @@ class TraduzSentencas(Thread):
35 analise_morfologica = alexp.getAnaliseMorfologica() 35 analise_morfologica = alexp.getAnaliseMorfologica()
36 36
37 if (isinstance(analise_sintatica,type(None))): 37 if (isinstance(analise_sintatica,type(None))):
38 - print "# ANÁLISE MORFÓLIGCA" 38 + print "# ANÁLISE MORFOLÓGICA"
39 regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) 39 regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica)
40 else: 40 else:
41 print "# ANÁLISE SINTÁTICA" 41 print "# ANÁLISE SINTÁTICA"
src/new/alexp.py
@@ -45,7 +45,8 @@ def toqueniza(s): @@ -45,7 +45,8 @@ def toqueniza(s):
45 return AnotaCorpus.TOK_PORT.tokenize(decodificada) 45 return AnotaCorpus.TOK_PORT.tokenize(decodificada)
46 46
47 def getAnaliseMorfologica(): 47 def getAnaliseMorfologica():
48 - return [list(x) for x in sentenca_anotada] 48 + return sentenca_anotada
  49 + #return [list(x) for x in sentenca_anotada]
49 50
50 def etiquetaSentenca(s): 51 def etiquetaSentenca(s):
51 """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. 52 """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens.
@@ -55,8 +56,9 @@ def etiquetaSentenca(s): @@ -55,8 +56,9 @@ def etiquetaSentenca(s):
55 while (anotada[0][1] is None): 56 while (anotada[0][1] is None):
56 time.sleep(random.choice(sleep_times)) 57 time.sleep(random.choice(sleep_times))
57 anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] 58 anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0]
58 - anotada[0] = (anotada[0][0].lower(), anotada[0][1])  
59 - return anotada 59 + #anotada[0] = (anotada[0][0].lower(), anotada[0][1])
  60 + #return anotada
  61 + return [[x[0].lower(),x[1]] for x in anotada]
60 62
61 def geraEntradasLexicais(lista): 63 def geraEntradasLexicais(lista):
62 """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. 64 """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas.