Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62
1 parent
0f5f05bc
Exists in
master
and in
1 other branch
Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao
Showing
6 changed files
with
44 additions
and
8 deletions
Show diff stats
data/regras.xml
| ... | ... | @@ -381,7 +381,7 @@ |
| 381 | 381 | <newtokenpos>1</newtokenpos> |
| 382 | 382 | </class> |
| 383 | 383 | </rule> |
| 384 | - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo --> | |
| 384 | + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo --> | |
| 385 | 385 | <active>true</active> |
| 386 | 386 | <count>1</count> |
| 387 | 387 | <class> | ... | ... |
src/new/LerDicionarios.py
| ... | ... | @@ -14,7 +14,7 @@ class LerDicionarios(object): |
| 14 | 14 | |
| 15 | 15 | def __init__(self): |
| 16 | 16 | self.path = self.get_path() |
| 17 | - self.dic_adv_intensidade = [] | |
| 17 | + self.dic_adv_intensidade = {} | |
| 18 | 18 | self.dic_adv_tempo = [] |
| 19 | 19 | self.dic_art = [] |
| 20 | 20 | self.dic_prep = [] |
| ... | ... | @@ -42,15 +42,14 @@ class LerDicionarios(object): |
| 42 | 42 | |
| 43 | 43 | def carregar_adverbios_intensidade(self): |
| 44 | 44 | try: |
| 45 | - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv")) | |
| 45 | + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";") | |
| 46 | 46 | except IOError, (errno, strerror): |
| 47 | 47 | print "I/O error(%s): %s" % (errno, strerror) |
| 48 | 48 | print "carregar_adverbios_intensidade" |
| 49 | - | |
| 50 | - rows = [] | |
| 49 | + | |
| 51 | 50 | for row in self.file: |
| 52 | - rows.append(row[0].decode("utf-8")) | |
| 53 | - self.dic_adv_intensidade = set(rows) | |
| 51 | + if row[1] != "": | |
| 52 | + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8") | |
| 54 | 53 | |
| 55 | 54 | def carregar_adverbios_tempo(self): |
| 56 | 55 | try: |
| ... | ... | @@ -135,7 +134,7 @@ class LerDicionarios(object): |
| 135 | 134 | self.dic_vb_ligacao = set(rows) |
| 136 | 135 | |
| 137 | 136 | def has_adverbio_intensidade(self, token): |
| 138 | - return token in self.dic_adv_intensidade | |
| 137 | + return self.dic_adv_intensidade.has_key(token) | |
| 139 | 138 | |
| 140 | 139 | def has_adverbio_tempo(self, token): |
| 141 | 140 | return token in self.dic_adv_tempo |
| ... | ... | @@ -158,6 +157,9 @@ class LerDicionarios(object): |
| 158 | 157 | def has_verbo_ligacao(self, token): |
| 159 | 158 | return token in self.dic_vb_ligacao |
| 160 | 159 | |
| 160 | + def get_adverbio_intensidade(self, token): | |
| 161 | + return self.dic_adv_intensidade[token] | |
| 162 | + | |
| 161 | 163 | def get_sinonimo(self, token): |
| 162 | 164 | return self.dic_sin[token] |
| 163 | 165 | ... | ... |