From 05257307027cda21615797b4d965c4ab2d88cf5c Mon Sep 17 00:00:00 2001 From: Erickson Silva Date: Tue, 22 Sep 2015 09:39:42 -0300 Subject: [PATCH] Adiciona verificação de palavras compostas de 3 tokens e atualiza lista de palavras compostas --- data/palavras_compostas.csv | 10 +++++----- src/AplicaSinonimos.py | 10 +++++++--- 2 files changed, 12 insertions(+), 8 deletions(-) diff --git a/data/palavras_compostas.csv b/data/palavras_compostas.csv index f4374fa..816b735 100644 --- a/data/palavras_compostas.csv +++ b/data/palavras_compostas.csv @@ -1,8 +1,8 @@ BELO_HORIZONTE BUMBA_MEU_BOI CAMPO_GRANDE -FERNANDO_DE_NORONHA -GUARDA_DE_TRÂNSITO +FERNANDO_NORONHA +GUARDA_TRÂNSITO JET_SKI NÃO_ADIANTAR NÃO_COMPARECER @@ -23,6 +23,6 @@ POR_FAVOR PORTO_VELHO REFORÇO_ESCOLAR RIO_BRANCO -RODÍZIO_DE_CARRO -ROLO_DE_MASSA -TÍTULO_DE_ELEITOR \ No newline at end of file +RODÍZIO_CARRO +ROLO_MASSA +TÍTULO_ELEITOR \ No newline at end of file diff --git a/src/AplicaSinonimos.py b/src/AplicaSinonimos.py index d3e5bfd..7f15634 100644 --- a/src/AplicaSinonimos.py +++ b/src/AplicaSinonimos.py @@ -31,9 +31,13 @@ class AplicaSinonimos(object): for tupla in lista_anotada: sinonimo = self.verificar_sinonimo(tupla[0]) try: - token_composto = lista_corrigida[-1] + "_" + sinonimo - if token_composto.upper() in palavras_compostas: - lista_corrigida[-1] = token_composto + token_composto_2 = lista_corrigida[-1] + "_" + sinonimo + token_composto_3 = lista_corrigida[-2] + "_" + lista_corrigida[-1] + "_" + sinonimo + if token_composto_2.upper() in palavras_compostas: + lista_corrigida[-1] = token_composto_2 + elif token_composto_3.upper() in palavras_compostas: + lista_corrigida.pop() + lista_corrigida[-1] = token_composto_3 else: lista_corrigida.append(sinonimo) except IndexError: -- libgit2 0.21.2