Commit f56fda5acd10b79bf72af42c6cea871293d7ad04

Authored by Erickson Silva
1 parent f86e2770
Exists in master and in 1 other branch devel

Modifica os tokens da lista da análise morfologica para minusculo

Showing 2 changed files with 6 additions and 4 deletions   Show diff stats
src/new/TraduzSentencas.py
... ... @@ -35,7 +35,7 @@ class TraduzSentencas(Thread):
35 35 analise_morfologica = alexp.getAnaliseMorfologica()
36 36  
37 37 if (isinstance(analise_sintatica,type(None))):
38   - print "# ANÁLISE MORFÓLIGCA"
  38 + print "# ANÁLISE MORFOLÓGICA"
39 39 regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica)
40 40 else:
41 41 print "# ANÁLISE SINTÁTICA"
... ...
src/new/alexp.py
... ... @@ -45,7 +45,8 @@ def toqueniza(s):
45 45 return AnotaCorpus.TOK_PORT.tokenize(decodificada)
46 46  
47 47 def getAnaliseMorfologica():
48   - return [list(x) for x in sentenca_anotada]
  48 + return sentenca_anotada
  49 + #return [list(x) for x in sentenca_anotada]
49 50  
50 51 def etiquetaSentenca(s):
51 52 """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens.
... ... @@ -55,8 +56,9 @@ def etiquetaSentenca(s):
55 56 while (anotada[0][1] is None):
56 57 time.sleep(random.choice(sleep_times))
57 58 anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0]
58   - anotada[0] = (anotada[0][0].lower(), anotada[0][1])
59   - return anotada
  59 + #anotada[0] = (anotada[0][0].lower(), anotada[0][1])
  60 + #return anotada
  61 + return [[x[0].lower(),x[1]] for x in anotada]
60 62  
61 63 def geraEntradasLexicais(lista):
62 64 """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas.
... ...