Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62

Authored by Erickson Silva
1 parent 0f5f05bc
Exists in master and in 1 other branch devel

Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao

data/adverbiosIntensidade.csv 0 → 100644
... ... @@ -0,0 +1,6 @@
  1 +muito;muito
  2 +demais;muito
  3 +pouco;pouco
  4 +menos;pouco
  5 +melhor;muito
  6 +pior;pouco
0 7 \ No newline at end of file
... ...
data/artigos.csv 0 → 100644
... ... @@ -0,0 +1,8 @@
  1 +a
  2 +as
  3 +o
  4 +os
  5 +um
  6 +uns
  7 +uma
  8 +umas
0 9 \ No newline at end of file
... ...
data/preposicoes.csv 0 → 100644
... ... @@ -0,0 +1,18 @@
  1 +em
  2 +na
  3 +no
  4 +nos
  5 +nas
  6 +de
  7 +da
  8 +do
  9 +dos
  10 +das
  11 +por
  12 +pelo
  13 +pela
  14 +pelos
  15 +pelas
  16 +para
  17 +ao
  18 +aos
0 19 \ No newline at end of file
... ...
data/regras.xml
... ... @@ -381,7 +381,7 @@
381 381 <newtokenpos>1</newtokenpos>
382 382 </class>
383 383 </rule>
384   - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo -->
  384 + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo -->
385 385 <active>true</active>
386 386 <count>1</count>
387 387 <class>
... ...
data/verbosLigacao.csv 0 → 100644
... ... @@ -0,0 +1,2 @@
  1 +ser
  2 +estar
0 3 \ No newline at end of file
... ...
src/new/LerDicionarios.py
... ... @@ -14,7 +14,7 @@ class LerDicionarios(object):
14 14  
15 15 def __init__(self):
16 16 self.path = self.get_path()
17   - self.dic_adv_intensidade = []
  17 + self.dic_adv_intensidade = {}
18 18 self.dic_adv_tempo = []
19 19 self.dic_art = []
20 20 self.dic_prep = []
... ... @@ -42,15 +42,14 @@ class LerDicionarios(object):
42 42  
43 43 def carregar_adverbios_intensidade(self):
44 44 try:
45   - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"))
  45 + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";")
46 46 except IOError, (errno, strerror):
47 47 print "I/O error(%s): %s" % (errno, strerror)
48 48 print "carregar_adverbios_intensidade"
49   -
50   - rows = []
  49 +
51 50 for row in self.file:
52   - rows.append(row[0].decode("utf-8"))
53   - self.dic_adv_intensidade = set(rows)
  51 + if row[1] != "":
  52 + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8")
54 53  
55 54 def carregar_adverbios_tempo(self):
56 55 try:
... ... @@ -135,7 +134,7 @@ class LerDicionarios(object):
135 134 self.dic_vb_ligacao = set(rows)
136 135  
137 136 def has_adverbio_intensidade(self, token):
138   - return token in self.dic_adv_intensidade
  137 + return self.dic_adv_intensidade.has_key(token)
139 138  
140 139 def has_adverbio_tempo(self, token):
141 140 return token in self.dic_adv_tempo
... ... @@ -158,6 +157,9 @@ class LerDicionarios(object):
158 157 def has_verbo_ligacao(self, token):
159 158 return token in self.dic_vb_ligacao
160 159  
  160 + def get_adverbio_intensidade(self, token):
  161 + return self.dic_adv_intensidade[token]
  162 +
161 163 def get_sinonimo(self, token):
162 164 return self.dic_sin[token]
163 165  
... ...