Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62
1 parent
0f5f05bc
Exists in
master
and in
1 other branch
Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao
Showing
6 changed files
with
44 additions
and
8 deletions
Show diff stats
data/regras.xml
| @@ -381,7 +381,7 @@ | @@ -381,7 +381,7 @@ | ||
| 381 | <newtokenpos>1</newtokenpos> | 381 | <newtokenpos>1</newtokenpos> |
| 382 | </class> | 382 | </class> |
| 383 | </rule> | 383 | </rule> |
| 384 | - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo --> | 384 | + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo --> |
| 385 | <active>true</active> | 385 | <active>true</active> |
| 386 | <count>1</count> | 386 | <count>1</count> |
| 387 | <class> | 387 | <class> |
src/new/LerDicionarios.py
| @@ -14,7 +14,7 @@ class LerDicionarios(object): | @@ -14,7 +14,7 @@ class LerDicionarios(object): | ||
| 14 | 14 | ||
| 15 | def __init__(self): | 15 | def __init__(self): |
| 16 | self.path = self.get_path() | 16 | self.path = self.get_path() |
| 17 | - self.dic_adv_intensidade = [] | 17 | + self.dic_adv_intensidade = {} |
| 18 | self.dic_adv_tempo = [] | 18 | self.dic_adv_tempo = [] |
| 19 | self.dic_art = [] | 19 | self.dic_art = [] |
| 20 | self.dic_prep = [] | 20 | self.dic_prep = [] |
| @@ -42,15 +42,14 @@ class LerDicionarios(object): | @@ -42,15 +42,14 @@ class LerDicionarios(object): | ||
| 42 | 42 | ||
| 43 | def carregar_adverbios_intensidade(self): | 43 | def carregar_adverbios_intensidade(self): |
| 44 | try: | 44 | try: |
| 45 | - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv")) | 45 | + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";") |
| 46 | except IOError, (errno, strerror): | 46 | except IOError, (errno, strerror): |
| 47 | print "I/O error(%s): %s" % (errno, strerror) | 47 | print "I/O error(%s): %s" % (errno, strerror) |
| 48 | print "carregar_adverbios_intensidade" | 48 | print "carregar_adverbios_intensidade" |
| 49 | - | ||
| 50 | - rows = [] | 49 | + |
| 51 | for row in self.file: | 50 | for row in self.file: |
| 52 | - rows.append(row[0].decode("utf-8")) | ||
| 53 | - self.dic_adv_intensidade = set(rows) | 51 | + if row[1] != "": |
| 52 | + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8") | ||
| 54 | 53 | ||
| 55 | def carregar_adverbios_tempo(self): | 54 | def carregar_adverbios_tempo(self): |
| 56 | try: | 55 | try: |
| @@ -135,7 +134,7 @@ class LerDicionarios(object): | @@ -135,7 +134,7 @@ class LerDicionarios(object): | ||
| 135 | self.dic_vb_ligacao = set(rows) | 134 | self.dic_vb_ligacao = set(rows) |
| 136 | 135 | ||
| 137 | def has_adverbio_intensidade(self, token): | 136 | def has_adverbio_intensidade(self, token): |
| 138 | - return token in self.dic_adv_intensidade | 137 | + return self.dic_adv_intensidade.has_key(token) |
| 139 | 138 | ||
| 140 | def has_adverbio_tempo(self, token): | 139 | def has_adverbio_tempo(self, token): |
| 141 | return token in self.dic_adv_tempo | 140 | return token in self.dic_adv_tempo |
| @@ -158,6 +157,9 @@ class LerDicionarios(object): | @@ -158,6 +157,9 @@ class LerDicionarios(object): | ||
| 158 | def has_verbo_ligacao(self, token): | 157 | def has_verbo_ligacao(self, token): |
| 159 | return token in self.dic_vb_ligacao | 158 | return token in self.dic_vb_ligacao |
| 160 | 159 | ||
| 160 | + def get_adverbio_intensidade(self, token): | ||
| 161 | + return self.dic_adv_intensidade[token] | ||
| 162 | + | ||
| 161 | def get_sinonimo(self, token): | 163 | def get_sinonimo(self, token): |
| 162 | return self.dic_sin[token] | 164 | return self.dic_sin[token] |
| 163 | 165 |