Commit f56fda5acd10b79bf72af42c6cea871293d7ad04
1 parent
f86e2770
Exists in
master
and in
1 other branch
Modifica os tokens da lista da análise morfologica para minusculo
Showing
2 changed files
with
6 additions
and
4 deletions
Show diff stats
src/new/TraduzSentencas.py
@@ -35,7 +35,7 @@ class TraduzSentencas(Thread): | @@ -35,7 +35,7 @@ class TraduzSentencas(Thread): | ||
35 | analise_morfologica = alexp.getAnaliseMorfologica() | 35 | analise_morfologica = alexp.getAnaliseMorfologica() |
36 | 36 | ||
37 | if (isinstance(analise_sintatica,type(None))): | 37 | if (isinstance(analise_sintatica,type(None))): |
38 | - print "# ANÁLISE MORFÓLIGCA" | 38 | + print "# ANÁLISE MORFOLÓGICA" |
39 | regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) | 39 | regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) |
40 | else: | 40 | else: |
41 | print "# ANÁLISE SINTÁTICA" | 41 | print "# ANÁLISE SINTÁTICA" |
src/new/alexp.py
@@ -45,7 +45,8 @@ def toqueniza(s): | @@ -45,7 +45,8 @@ def toqueniza(s): | ||
45 | return AnotaCorpus.TOK_PORT.tokenize(decodificada) | 45 | return AnotaCorpus.TOK_PORT.tokenize(decodificada) |
46 | 46 | ||
47 | def getAnaliseMorfologica(): | 47 | def getAnaliseMorfologica(): |
48 | - return [list(x) for x in sentenca_anotada] | 48 | + return sentenca_anotada |
49 | + #return [list(x) for x in sentenca_anotada] | ||
49 | 50 | ||
50 | def etiquetaSentenca(s): | 51 | def etiquetaSentenca(s): |
51 | """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. | 52 | """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. |
@@ -55,8 +56,9 @@ def etiquetaSentenca(s): | @@ -55,8 +56,9 @@ def etiquetaSentenca(s): | ||
55 | while (anotada[0][1] is None): | 56 | while (anotada[0][1] is None): |
56 | time.sleep(random.choice(sleep_times)) | 57 | time.sleep(random.choice(sleep_times)) |
57 | anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] | 58 | anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] |
58 | - anotada[0] = (anotada[0][0].lower(), anotada[0][1]) | ||
59 | - return anotada | 59 | + #anotada[0] = (anotada[0][0].lower(), anotada[0][1]) |
60 | + #return anotada | ||
61 | + return [[x[0].lower(),x[1]] for x in anotada] | ||
60 | 62 | ||
61 | def geraEntradasLexicais(lista): | 63 | def geraEntradasLexicais(lista): |
62 | """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. | 64 | """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. |