Commit 05257307027cda21615797b4d965c4ab2d88cf5c
1 parent
37a7ee72
Exists in
master
and in
1 other branch
Adiciona verificação de palavras compostas de 3 tokens e atualiza lista de palavras compostas
Showing
2 changed files
with
12 additions
and
8 deletions
Show diff stats
data/palavras_compostas.csv
| 1 | 1 | BELO_HORIZONTE |
| 2 | 2 | BUMBA_MEU_BOI |
| 3 | 3 | CAMPO_GRANDE |
| 4 | -FERNANDO_DE_NORONHA | |
| 5 | -GUARDA_DE_TRÂNSITO | |
| 4 | +FERNANDO_NORONHA | |
| 5 | +GUARDA_TRÂNSITO | |
| 6 | 6 | JET_SKI |
| 7 | 7 | NÃO_ADIANTAR |
| 8 | 8 | NÃO_COMPARECER |
| ... | ... | @@ -23,6 +23,6 @@ POR_FAVOR |
| 23 | 23 | PORTO_VELHO |
| 24 | 24 | REFORÇO_ESCOLAR |
| 25 | 25 | RIO_BRANCO |
| 26 | -RODÍZIO_DE_CARRO | |
| 27 | -ROLO_DE_MASSA | |
| 28 | -TÍTULO_DE_ELEITOR | |
| 29 | 26 | \ No newline at end of file |
| 27 | +RODÍZIO_CARRO | |
| 28 | +ROLO_MASSA | |
| 29 | +TÍTULO_ELEITOR | |
| 30 | 30 | \ No newline at end of file | ... | ... |
src/AplicaSinonimos.py
| ... | ... | @@ -31,9 +31,13 @@ class AplicaSinonimos(object): |
| 31 | 31 | for tupla in lista_anotada: |
| 32 | 32 | sinonimo = self.verificar_sinonimo(tupla[0]) |
| 33 | 33 | try: |
| 34 | - token_composto = lista_corrigida[-1] + "_" + sinonimo | |
| 35 | - if token_composto.upper() in palavras_compostas: | |
| 36 | - lista_corrigida[-1] = token_composto | |
| 34 | + token_composto_2 = lista_corrigida[-1] + "_" + sinonimo | |
| 35 | + token_composto_3 = lista_corrigida[-2] + "_" + lista_corrigida[-1] + "_" + sinonimo | |
| 36 | + if token_composto_2.upper() in palavras_compostas: | |
| 37 | + lista_corrigida[-1] = token_composto_2 | |
| 38 | + elif token_composto_3.upper() in palavras_compostas: | |
| 39 | + lista_corrigida.pop() | |
| 40 | + lista_corrigida[-1] = token_composto_3 | |
| 37 | 41 | else: |
| 38 | 42 | lista_corrigida.append(sinonimo) |
| 39 | 43 | except IndexError: | ... | ... |