Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62
1 parent
0f5f05bc
Exists in
master
and in
1 other branch
Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao
Showing
6 changed files
with
44 additions
and
8 deletions
Show diff stats
data/regras.xml
... | ... | @@ -381,7 +381,7 @@ |
381 | 381 | <newtokenpos>1</newtokenpos> |
382 | 382 | </class> |
383 | 383 | </rule> |
384 | - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo --> | |
384 | + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo --> | |
385 | 385 | <active>true</active> |
386 | 386 | <count>1</count> |
387 | 387 | <class> | ... | ... |
src/new/LerDicionarios.py
... | ... | @@ -14,7 +14,7 @@ class LerDicionarios(object): |
14 | 14 | |
15 | 15 | def __init__(self): |
16 | 16 | self.path = self.get_path() |
17 | - self.dic_adv_intensidade = [] | |
17 | + self.dic_adv_intensidade = {} | |
18 | 18 | self.dic_adv_tempo = [] |
19 | 19 | self.dic_art = [] |
20 | 20 | self.dic_prep = [] |
... | ... | @@ -42,15 +42,14 @@ class LerDicionarios(object): |
42 | 42 | |
43 | 43 | def carregar_adverbios_intensidade(self): |
44 | 44 | try: |
45 | - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv")) | |
45 | + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";") | |
46 | 46 | except IOError, (errno, strerror): |
47 | 47 | print "I/O error(%s): %s" % (errno, strerror) |
48 | 48 | print "carregar_adverbios_intensidade" |
49 | - | |
50 | - rows = [] | |
49 | + | |
51 | 50 | for row in self.file: |
52 | - rows.append(row[0].decode("utf-8")) | |
53 | - self.dic_adv_intensidade = set(rows) | |
51 | + if row[1] != "": | |
52 | + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8") | |
54 | 53 | |
55 | 54 | def carregar_adverbios_tempo(self): |
56 | 55 | try: |
... | ... | @@ -135,7 +134,7 @@ class LerDicionarios(object): |
135 | 134 | self.dic_vb_ligacao = set(rows) |
136 | 135 | |
137 | 136 | def has_adverbio_intensidade(self, token): |
138 | - return token in self.dic_adv_intensidade | |
137 | + return self.dic_adv_intensidade.has_key(token) | |
139 | 138 | |
140 | 139 | def has_adverbio_tempo(self, token): |
141 | 140 | return token in self.dic_adv_tempo |
... | ... | @@ -158,6 +157,9 @@ class LerDicionarios(object): |
158 | 157 | def has_verbo_ligacao(self, token): |
159 | 158 | return token in self.dic_vb_ligacao |
160 | 159 | |
160 | + def get_adverbio_intensidade(self, token): | |
161 | + return self.dic_adv_intensidade[token] | |
162 | + | |
161 | 163 | def get_sinonimo(self, token): |
162 | 164 | return self.dic_sin[token] |
163 | 165 | ... | ... |