Commit 0b82304d9d6fcdf965b33df19bc42a9732a58e62

Authored by Erickson Silva
1 parent 0f5f05bc
Exists in master and in 1 other branch devel

Adiciona dicionarios de adverbios de intensidade, artigos, preposicoes e verbos de ligacao

data/adverbiosIntensidade.csv 0 → 100644
@@ -0,0 +1,6 @@ @@ -0,0 +1,6 @@
  1 +muito;muito
  2 +demais;muito
  3 +pouco;pouco
  4 +menos;pouco
  5 +melhor;muito
  6 +pior;pouco
0 \ No newline at end of file 7 \ No newline at end of file
data/artigos.csv 0 → 100644
@@ -0,0 +1,8 @@ @@ -0,0 +1,8 @@
  1 +a
  2 +as
  3 +o
  4 +os
  5 +um
  6 +uns
  7 +uma
  8 +umas
0 \ No newline at end of file 9 \ No newline at end of file
data/preposicoes.csv 0 → 100644
@@ -0,0 +1,18 @@ @@ -0,0 +1,18 @@
  1 +em
  2 +na
  3 +no
  4 +nos
  5 +nas
  6 +de
  7 +da
  8 +do
  9 +dos
  10 +das
  11 +por
  12 +pelo
  13 +pela
  14 +pelos
  15 +pelas
  16 +para
  17 +ao
  18 +aos
0 \ No newline at end of file 19 \ No newline at end of file
data/regras.xml
@@ -381,7 +381,7 @@ @@ -381,7 +381,7 @@
381 <newtokenpos>1</newtokenpos> 381 <newtokenpos>1</newtokenpos>
382 </class> 382 </class>
383 </rule> 383 </rule>
384 - <rule name = "VB-SD)"><!-- verbo no infinitivo – passado do subjuntivo --> 384 + <rule name = "VB-SD"><!-- verbo no infinitivo – passado do subjuntivo -->
385 <active>true</active> 385 <active>true</active>
386 <count>1</count> 386 <count>1</count>
387 <class> 387 <class>
data/verbosLigacao.csv 0 → 100644
@@ -0,0 +1,2 @@ @@ -0,0 +1,2 @@
  1 +ser
  2 +estar
0 \ No newline at end of file 3 \ No newline at end of file
src/new/LerDicionarios.py
@@ -14,7 +14,7 @@ class LerDicionarios(object): @@ -14,7 +14,7 @@ class LerDicionarios(object):
14 14
15 def __init__(self): 15 def __init__(self):
16 self.path = self.get_path() 16 self.path = self.get_path()
17 - self.dic_adv_intensidade = [] 17 + self.dic_adv_intensidade = {}
18 self.dic_adv_tempo = [] 18 self.dic_adv_tempo = []
19 self.dic_art = [] 19 self.dic_art = []
20 self.dic_prep = [] 20 self.dic_prep = []
@@ -42,15 +42,14 @@ class LerDicionarios(object): @@ -42,15 +42,14 @@ class LerDicionarios(object):
42 42
43 def carregar_adverbios_intensidade(self): 43 def carregar_adverbios_intensidade(self):
44 try: 44 try:
45 - self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv")) 45 + self.file = csv.reader(open(self.path+"adverbiosIntensidade.csv"), delimiter=";")
46 except IOError, (errno, strerror): 46 except IOError, (errno, strerror):
47 print "I/O error(%s): %s" % (errno, strerror) 47 print "I/O error(%s): %s" % (errno, strerror)
48 print "carregar_adverbios_intensidade" 48 print "carregar_adverbios_intensidade"
49 -  
50 - rows = [] 49 +
51 for row in self.file: 50 for row in self.file:
52 - rows.append(row[0].decode("utf-8"))  
53 - self.dic_adv_intensidade = set(rows) 51 + if row[1] != "":
  52 + self.dic_adv_intensidade[row[0].decode("utf-8")] = row[1].decode("utf-8")
54 53
55 def carregar_adverbios_tempo(self): 54 def carregar_adverbios_tempo(self):
56 try: 55 try:
@@ -135,7 +134,7 @@ class LerDicionarios(object): @@ -135,7 +134,7 @@ class LerDicionarios(object):
135 self.dic_vb_ligacao = set(rows) 134 self.dic_vb_ligacao = set(rows)
136 135
137 def has_adverbio_intensidade(self, token): 136 def has_adverbio_intensidade(self, token):
138 - return token in self.dic_adv_intensidade 137 + return self.dic_adv_intensidade.has_key(token)
139 138
140 def has_adverbio_tempo(self, token): 139 def has_adverbio_tempo(self, token):
141 return token in self.dic_adv_tempo 140 return token in self.dic_adv_tempo
@@ -158,6 +157,9 @@ class LerDicionarios(object): @@ -158,6 +157,9 @@ class LerDicionarios(object):
158 def has_verbo_ligacao(self, token): 157 def has_verbo_ligacao(self, token):
159 return token in self.dic_vb_ligacao 158 return token in self.dic_vb_ligacao
160 159
  160 + def get_adverbio_intensidade(self, token):
  161 + return self.dic_adv_intensidade[token]
  162 +
161 def get_sinonimo(self, token): 163 def get_sinonimo(self, token):
162 return self.dic_sin[token] 164 return self.dic_sin[token]
163 165