Commit f56fda5acd10b79bf72af42c6cea871293d7ad04
1 parent
f86e2770
Exists in
master
and in
1 other branch
Modifica os tokens da lista da análise morfologica para minusculo
Showing
2 changed files
with
6 additions
and
4 deletions
Show diff stats
src/new/TraduzSentencas.py
| ... | ... | @@ -35,7 +35,7 @@ class TraduzSentencas(Thread): |
| 35 | 35 | analise_morfologica = alexp.getAnaliseMorfologica() |
| 36 | 36 | |
| 37 | 37 | if (isinstance(analise_sintatica,type(None))): |
| 38 | - print "# ANÁLISE MORFÓLIGCA" | |
| 38 | + print "# ANÁLISE MORFOLÓGICA" | |
| 39 | 39 | regras_aplicadas = self.aplic_regras.aplicar_regras_morfo(analise_morfologica) |
| 40 | 40 | else: |
| 41 | 41 | print "# ANÁLISE SINTÁTICA" | ... | ... |
src/new/alexp.py
| ... | ... | @@ -45,7 +45,8 @@ def toqueniza(s): |
| 45 | 45 | return AnotaCorpus.TOK_PORT.tokenize(decodificada) |
| 46 | 46 | |
| 47 | 47 | def getAnaliseMorfologica(): |
| 48 | - return [list(x) for x in sentenca_anotada] | |
| 48 | + return sentenca_anotada | |
| 49 | + #return [list(x) for x in sentenca_anotada] | |
| 49 | 50 | |
| 50 | 51 | def etiquetaSentenca(s): |
| 51 | 52 | """Aplica um dos etiquetadores do Aelius na etiquetagem da sentença dada como lista de tokens. |
| ... | ... | @@ -55,8 +56,9 @@ def etiquetaSentenca(s): |
| 55 | 56 | while (anotada[0][1] is None): |
| 56 | 57 | time.sleep(random.choice(sleep_times)) |
| 57 | 58 | anotada = AnotaCorpus.anota_sentencas([s],etiquetador,"hunpos")[0] |
| 58 | - anotada[0] = (anotada[0][0].lower(), anotada[0][1]) | |
| 59 | - return anotada | |
| 59 | + #anotada[0] = (anotada[0][0].lower(), anotada[0][1]) | |
| 60 | + #return anotada | |
| 61 | + return [[x[0].lower(),x[1]] for x in anotada] | |
| 60 | 62 | |
| 61 | 63 | def geraEntradasLexicais(lista): |
| 62 | 64 | """Gera entradas lexicais no formato CFG do NLTK a partir de lista de pares constituídos de tokens e suas etiquetas. | ... | ... |