Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62
1 parent
0f5f05bc
Exists in
master
and in
1 other branch
Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao
Showing
6 changed files
with
44 additions
and
8 deletions
Show diff stats
data/regras.xml
@@ -381,7 +381,7 @@ | @@ -381,7 +381,7 @@ | ||
381 | <newtokenpos>1</newtokenpos> | 381 | <newtokenpos>1</newtokenpos> |
382 | </class> | 382 | </class> |
383 | </rule> | 383 | </rule> |
384 | - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo --> | 384 | + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo --> |
385 | <active>true</active> | 385 | <active>true</active> |
386 | <count>1</count> | 386 | <count>1</count> |
387 | <class> | 387 | <class> |
src/new/LerDicionarios.py
@@ -14,7 +14,7 @@ class LerDicionarios(object): | @@ -14,7 +14,7 @@ class LerDicionarios(object): | ||
14 | 14 | ||
15 | def __init__(self): | 15 | def __init__(self): |
16 | self.path = self.get_path() | 16 | self.path = self.get_path() |
17 | - self.dic_adv_intensidade = [] | 17 | + self.dic_adv_intensidade = {} |
18 | self.dic_adv_tempo = [] | 18 | self.dic_adv_tempo = [] |
19 | self.dic_art = [] | 19 | self.dic_art = [] |
20 | self.dic_prep = [] | 20 | self.dic_prep = [] |
@@ -42,15 +42,14 @@ class LerDicionarios(object): | @@ -42,15 +42,14 @@ class LerDicionarios(object): | ||
42 | 42 | ||
43 | def carregar_adverbios_intensidade(self): | 43 | def carregar_adverbios_intensidade(self): |
44 | try: | 44 | try: |
45 | - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv")) | 45 | + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";") |
46 | except IOError, (errno, strerror): | 46 | except IOError, (errno, strerror): |
47 | print "I/O error(%s): %s" % (errno, strerror) | 47 | print "I/O error(%s): %s" % (errno, strerror) |
48 | print "carregar_adverbios_intensidade" | 48 | print "carregar_adverbios_intensidade" |
49 | - | ||
50 | - rows = [] | 49 | + |
51 | for row in self.file: | 50 | for row in self.file: |
52 | - rows.append(row[0].decode("utf-8")) | ||
53 | - self.dic_adv_intensidade = set(rows) | 51 | + if row[1] != "": |
52 | + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8") | ||
54 | 53 | ||
55 | def carregar_adverbios_tempo(self): | 54 | def carregar_adverbios_tempo(self): |
56 | try: | 55 | try: |
@@ -135,7 +134,7 @@ class LerDicionarios(object): | @@ -135,7 +134,7 @@ class LerDicionarios(object): | ||
135 | self.dic_vb_ligacao = set(rows) | 134 | self.dic_vb_ligacao = set(rows) |
136 | 135 | ||
137 | def has_adverbio_intensidade(self, token): | 136 | def has_adverbio_intensidade(self, token): |
138 | - return token in self.dic_adv_intensidade | 137 | + return self.dic_adv_intensidade.has_key(token) |
139 | 138 | ||
140 | def has_adverbio_tempo(self, token): | 139 | def has_adverbio_tempo(self, token): |
141 | return token in self.dic_adv_tempo | 140 | return token in self.dic_adv_tempo |
@@ -158,6 +157,9 @@ class LerDicionarios(object): | @@ -158,6 +157,9 @@ class LerDicionarios(object): | ||
158 | def has_verbo_ligacao(self, token): | 157 | def has_verbo_ligacao(self, token): |
159 | return token in self.dic_vb_ligacao | 158 | return token in self.dic_vb_ligacao |
160 | 159 | ||
160 | + def get_adverbio_intensidade(self, token): | ||
161 | + return self.dic_adv_intensidade[token] | ||
162 | + | ||
161 | def get_sinonimo(self, token): | 163 | def get_sinonimo(self, token): |
162 | return self.dic_sin[token] | 164 | return self.dic_sin[token] |
163 | 165 |