Commit 05257307027cda21615797b4d965c4ab2d88cf5c
1 parent
37a7ee72
Exists in
master
and in
1 other branch
Adiciona verificação de palavras compostas de 3 tokens e atualiza lista de palavras compostas
Showing
2 changed files
with
12 additions
and
8 deletions
Show diff stats
data/palavras_compostas.csv
1 | 1 | BELO_HORIZONTE |
2 | 2 | BUMBA_MEU_BOI |
3 | 3 | CAMPO_GRANDE |
4 | -FERNANDO_DE_NORONHA | |
5 | -GUARDA_DE_TRÂNSITO | |
4 | +FERNANDO_NORONHA | |
5 | +GUARDA_TRÂNSITO | |
6 | 6 | JET_SKI |
7 | 7 | NÃO_ADIANTAR |
8 | 8 | NÃO_COMPARECER |
... | ... | @@ -23,6 +23,6 @@ POR_FAVOR |
23 | 23 | PORTO_VELHO |
24 | 24 | REFORÇO_ESCOLAR |
25 | 25 | RIO_BRANCO |
26 | -RODÍZIO_DE_CARRO | |
27 | -ROLO_DE_MASSA | |
28 | -TÍTULO_DE_ELEITOR | |
29 | 26 | \ No newline at end of file |
27 | +RODÍZIO_CARRO | |
28 | +ROLO_MASSA | |
29 | +TÍTULO_ELEITOR | |
30 | 30 | \ No newline at end of file | ... | ... |
src/AplicaSinonimos.py
... | ... | @@ -31,9 +31,13 @@ class AplicaSinonimos(object): |
31 | 31 | for tupla in lista_anotada: |
32 | 32 | sinonimo = self.verificar_sinonimo(tupla[0]) |
33 | 33 | try: |
34 | - token_composto = lista_corrigida[-1] + "_" + sinonimo | |
35 | - if token_composto.upper() in palavras_compostas: | |
36 | - lista_corrigida[-1] = token_composto | |
34 | + token_composto_2 = lista_corrigida[-1] + "_" + sinonimo | |
35 | + token_composto_3 = lista_corrigida[-2] + "_" + lista_corrigida[-1] + "_" + sinonimo | |
36 | + if token_composto_2.upper() in palavras_compostas: | |
37 | + lista_corrigida[-1] = token_composto_2 | |
38 | + elif token_composto_3.upper() in palavras_compostas: | |
39 | + lista_corrigida.pop() | |
40 | + lista_corrigida[-1] = token_composto_3 | |
37 | 41 | else: |
38 | 42 | lista_corrigida.append(sinonimo) |
39 | 43 | except IndexError: | ... | ... |