Commit 2bd908fccacab5d7aff6b50c88eb1e8831c3af90
1 parent
ea7323f4
Exists in
master
and in
2 other branches
Adicionado tratamento de tempo verbal no tradutor.
Showing
7 changed files
with
109 additions
and
16 deletions
Show diff stats
ModuleTranslate.py
@@ -3,7 +3,6 @@ | @@ -3,7 +3,6 @@ | ||
3 | 3 | ||
4 | import sys, os | 4 | import sys, os |
5 | sys.path.append(os.getcwd()+"/tradutor/src/py") | 5 | sys.path.append(os.getcwd()+"/tradutor/src/py") |
6 | -#sys.path.append(os.path.expanduser("~/gtaaas/tradutor/src/py")) | ||
7 | from Tradutor import * | 6 | from Tradutor import * |
8 | 7 | ||
9 | tradutor = Tradutor() | 8 | tradutor = Tradutor() |
data/dicPortGlosa.csv
@@ -98462,7 +98462,7 @@ DEMOCRATIZASTE;DEMOCRATIZAR;all;;;;;;;;;ver | @@ -98462,7 +98462,7 @@ DEMOCRATIZASTE;DEMOCRATIZAR;all;;;;;;;;;ver | ||
98462 | SUAVAS;SUAR;all;;;;;;;;;ver | 98462 | SUAVAS;SUAR;all;;;;;;;;;ver |
98463 | AMANTE;AMANTE;all;;;;;;;;;adj, sub | 98463 | AMANTE;AMANTE;all;;;;;;;;;adj, sub |
98464 | ESTUDO;ESTUDAR;all;;;;;;;;;ver, sub | 98464 | ESTUDO;ESTUDAR;all;;;;;;;;;ver, sub |
98465 | -FUI;SER;all;IR;ver;;;;;;;ver | 98465 | +FUI;IR;all;;ver;;;;;;;ver |
98466 | CONTRADIGAIS;CONTRADIZER;all;;;;;;;;;ver | 98466 | CONTRADIGAIS;CONTRADIZER;all;;;;;;;;;ver |
98467 | APERTAS;APERTAR;all;;;;;;;;;ver | 98467 | APERTAS;APERTAR;all;;;;;;;;;ver |
98468 | AUXILIARIAMOS;AUXILIAR;all;;;;;;;;;ver | 98468 | AUXILIARIAMOS;AUXILIAR;all;;;;;;;;;ver |
servico/src/serviceWindowGeneration.cpp
@@ -43,8 +43,7 @@ bool ServiceWindowGeneration::isRunning() { | @@ -43,8 +43,7 @@ bool ServiceWindowGeneration::isRunning() { | ||
43 | 43 | ||
44 | /* Quando o sincronizador termina, ele invoca esse método para avisar! */ | 44 | /* Quando o sincronizador termina, ele invoca esse método para avisar! */ |
45 | void ServiceWindowGeneration::finalizouSincronizacao() { | 45 | void ServiceWindowGeneration::finalizouSincronizacao() { |
46 | - char op = this->getRunningOption(); | ||
47 | - if (op != '2' && serviceType != SERVICE_TYPE_TEXT && serviceType != SERVICE_TYPE_SRT_ONLY) { | 46 | + if (getRunningOption() != '2' && serviceType != SERVICE_TYPE_TEXT && serviceType != SERVICE_TYPE_SRT_ONLY) { |
48 | mixer = new Mixer(); | 47 | mixer = new Mixer(); |
49 | mixer->initialize(this->path_input, this->path_libras,this->position,this->size,this->transparency); | 48 | mixer->initialize(this->path_input, this->path_libras,this->position,this->size,this->transparency); |
50 | } | 49 | } |
tradutor/src/py/Simplificador.py
@@ -17,6 +17,7 @@ class Simplificador(object): | @@ -17,6 +17,7 @@ class Simplificador(object): | ||
17 | self.__dicSin = {} | 17 | self.__dicSin = {} |
18 | self.__dicWords = {} | 18 | self.__dicWords = {} |
19 | self.__dic2Gen = {} | 19 | self.__dic2Gen = {} |
20 | + self.__dicTemVerbs = {} | ||
20 | self.executeWorkCSV() | 21 | self.executeWorkCSV() |
21 | 22 | ||
22 | # retira artigos e preposicoes; passa verbos para infinitivo e verificar se há sinonimos | 23 | # retira artigos e preposicoes; passa verbos para infinitivo e verificar se há sinonimos |
@@ -24,11 +25,21 @@ class Simplificador(object): | @@ -24,11 +25,21 @@ class Simplificador(object): | ||
24 | self.__ts = [] | 25 | self.__ts = [] |
25 | self.it.load(texto) | 26 | self.it.load(texto) |
26 | self.__b = False | 27 | self.__b = False |
28 | + self.__verb = False | ||
29 | + self.__adv = False; | ||
30 | + self.__countVerb = 0 | ||
31 | + self.__countAdv = 0 | ||
27 | while(self.it.hasNext()): | 32 | while(self.it.hasNext()): |
28 | w = self.auxConvert(self.it.getAtualW()) | 33 | w = self.auxConvert(self.it.getAtualW()) |
29 | t = self.it.getAtualT() | 34 | t = self.it.getAtualT() |
30 | if self.__dicWords.has_key(t) == False: # verifica se nao eh artigo/preposicao | 35 | if self.__dicWords.has_key(t) == False: # verifica se nao eh artigo/preposicao |
31 | wu = w.upper() # deixa o token maiusculo | 36 | wu = w.upper() # deixa o token maiusculo |
37 | + if t[:2] == "VB": | ||
38 | + self.__verb = True | ||
39 | + self.__countVerb += 1 | ||
40 | + if t[:3] == "ADV": | ||
41 | + self.__adv = True | ||
42 | + self.__countAdv += 1 | ||
32 | if self.__dicInf.has_key(wu): # verifica se ha um verbo infinitivo desse token | 43 | if self.__dicInf.has_key(wu): # verifica se ha um verbo infinitivo desse token |
33 | sAux = self.__dicInf[wu] # se sim, adiciona numa string aux | 44 | sAux = self.__dicInf[wu] # se sim, adiciona numa string aux |
34 | if self.__dicSin.has_key(sAux): # verifica se ha um sinonimo para esse verbo infinitivo | 45 | if self.__dicSin.has_key(sAux): # verifica se ha um sinonimo para esse verbo infinitivo |
@@ -42,6 +53,7 @@ class Simplificador(object): | @@ -42,6 +53,7 @@ class Simplificador(object): | ||
42 | self.__bSin = True | 53 | self.__bSin = True |
43 | 54 | ||
44 | if self.__dic2Gen.has_key(wu): | 55 | if self.__dic2Gen.has_key(wu): |
56 | + del self.__ts[-1] | ||
45 | lenTicket = len(self.it.getAntT()) | 57 | lenTicket = len(self.it.getAntT()) |
46 | if ((self.__dicWords.has_key(self.it.getAntT())) and (self.it.getAntT()[lenTicket-1:] == "F") or (self.it.getAntT()[lenTicket-3:] == "F-P")): | 58 | if ((self.__dicWords.has_key(self.it.getAntT())) and (self.it.getAntT()[lenTicket-1:] == "F") or (self.it.getAntT()[lenTicket-3:] == "F-P")): |
47 | self.__ts.append(["MULHER " + wu,t]) | 59 | self.__ts.append(["MULHER " + wu,t]) |
@@ -50,21 +62,18 @@ class Simplificador(object): | @@ -50,21 +62,18 @@ class Simplificador(object): | ||
50 | self.__b = True | 62 | self.__b = True |
51 | if self.__b == False: # verifica se nao encontrou nem verbo infinito ou sinonimo | 63 | if self.__b == False: # verifica se nao encontrou nem verbo infinito ou sinonimo |
52 | self.__ts.append([wu,t]) | 64 | self.__ts.append([wu,t]) |
53 | - self.__b = False | ||
54 | - | ||
55 | self.it.reset() | 65 | self.it.reset() |
66 | + if self.__verb == True: | ||
67 | + return self.verbalAnalysis(self.__ts) | ||
56 | return self.__ts | 68 | return self.__ts |
57 | 69 | ||
58 | # cria e recupera todos os dicionarios (verbos inf., sinonimos e artigos/preposicoes) | 70 | # cria e recupera todos os dicionarios (verbos inf., sinonimos e artigos/preposicoes) |
59 | def executeWorkCSV(self): | 71 | def executeWorkCSV(self): |
60 | - self.__csv.createDicInf() | ||
61 | - self.__csv.createDicSin() | ||
62 | - self.__csv.createDicWords() | ||
63 | - self.__csv.createDic2Gen() | ||
64 | self.__dicInf = self.__csv.getDicInf() | 72 | self.__dicInf = self.__csv.getDicInf() |
65 | self.__dicSin = self.__csv.getDicSin() | 73 | self.__dicSin = self.__csv.getDicSin() |
66 | self.__dicWords = self.__csv.getDicWords() | 74 | self.__dicWords = self.__csv.getDicWords() |
67 | self.__dic2Gen = self.__csv.getDic2Gen() | 75 | self.__dic2Gen = self.__csv.getDic2Gen() |
76 | + self.__dicTemVerbs = self.__csv.getDicTemVerbs() | ||
68 | 77 | ||
69 | # converte romano para numero/numero para palavra | 78 | # converte romano para numero/numero para palavra |
70 | def auxConvert(self, t): | 79 | def auxConvert(self, t): |
@@ -74,4 +83,55 @@ class Simplificador(object): | @@ -74,4 +83,55 @@ class Simplificador(object): | ||
74 | except: | 83 | except: |
75 | if t.isdigit(): | 84 | if t.isdigit(): |
76 | return extenso(t).decode("utf-8") | 85 | return extenso(t).decode("utf-8") |
77 | - return t | ||
78 | \ No newline at end of file | 86 | \ No newline at end of file |
87 | + return t | ||
88 | + | ||
89 | + | ||
90 | + def verbalAnalysis(self, lista): | ||
91 | + lv = [] | ||
92 | + self.it.load(lista) | ||
93 | + hasFut = False | ||
94 | + hasPas = False | ||
95 | + count = 0 | ||
96 | + while(self.it.hasNext()): | ||
97 | + w = self.it.getAtualW().upper() | ||
98 | + t = self.it.getAtualT() | ||
99 | + | ||
100 | + if(t[:3] == "ADV"): | ||
101 | + if (self.__dicTemVerbs.has_key(w)): | ||
102 | + self.it.reset() | ||
103 | + #print "ADV: retornou lista original" | ||
104 | + return lista | ||
105 | + | ||
106 | + if(t == "VB-P"): | ||
107 | + if (self.__countVerb > 1): | ||
108 | + count += 1 | ||
109 | + #print "VB-P: Incrementou" | ||
110 | + if(count == self.__countVerb): | ||
111 | + #print "VB-P Adicionou " + w | ||
112 | + lv.append([w,t]) | ||
113 | + else: | ||
114 | + #print "VB-P: retornou lista original" | ||
115 | + self.it.reset() | ||
116 | + return lista | ||
117 | + elif(t == "VB-D"): | ||
118 | + count += 1 | ||
119 | + hasPas = True | ||
120 | + #print "VB-D: Incrementou" | ||
121 | + if(count == self.__countVerb): | ||
122 | + #print "VB-D Adicionou " + w | ||
123 | + lv.append([w,t]) | ||
124 | + elif(t == "VB-R"): | ||
125 | + count += 1 | ||
126 | + hasFut = True | ||
127 | + #print "VB-R: Incrementou" | ||
128 | + if(count == self.__countVerb): | ||
129 | + #print "VB-R Adicionou " + w | ||
130 | + lv.append([w,t]) | ||
131 | + else: | ||
132 | + lv.append([w,t]) | ||
133 | + if (hasFut): | ||
134 | + lv.append(["FUTURO", "TVB"]) | ||
135 | + elif (hasPas): | ||
136 | + lv.append(["PASSADO", "TVB"]) | ||
137 | + self.it.reset() | ||
138 | + return lv | ||
79 | \ No newline at end of file | 139 | \ No newline at end of file |
tradutor/src/py/Tradutor.py
@@ -29,7 +29,7 @@ class Tradutor(object): | @@ -29,7 +29,7 @@ class Tradutor(object): | ||
29 | #retira artigos e preposicoes | 29 | #retira artigos e preposicoes |
30 | self.__ts = self.__simplificador.simplificar(self.__t) | 30 | self.__ts = self.__simplificador.simplificar(self.__t) |
31 | self.__t = None | 31 | self.__t = None |
32 | - | 32 | + |
33 | #aplica as regras | 33 | #aplica as regras |
34 | #self.__tr = self.__regras.aplicarRegras(self.__ts) | 34 | #self.__tr = self.__regras.aplicarRegras(self.__ts) |
35 | #self.__ts = None | 35 | #self.__ts = None |
tradutor/src/py/WorkCSV.py
@@ -19,6 +19,13 @@ class WorkCSV(object): | @@ -19,6 +19,13 @@ class WorkCSV(object): | ||
19 | self.__dicWords = {} | 19 | self.__dicWords = {} |
20 | self.__file2Gen = '' | 20 | self.__file2Gen = '' |
21 | self.__dic2Gen = {} | 21 | self.__dic2Gen = {} |
22 | + self.__fileTemVerbs = '' | ||
23 | + self.__dicTemVerbs = {} | ||
24 | + self.createDicInf() | ||
25 | + self.createDicSin() | ||
26 | + self.createDicWords() | ||
27 | + self.createDic2Gen() | ||
28 | + self.createDicTemVerbs() | ||
22 | 29 | ||
23 | # Abre o arquivo que contem os verbos no infinitivo e preenche o dicionario com os mesmos | 30 | # Abre o arquivo que contem os verbos no infinitivo e preenche o dicionario com os mesmos |
24 | def createDicInf(self): | 31 | def createDicInf(self): |
@@ -46,9 +53,18 @@ class WorkCSV(object): | @@ -46,9 +53,18 @@ class WorkCSV(object): | ||
46 | for row in self.__fileSin: | 53 | for row in self.__fileSin: |
47 | if row[1] != "": | 54 | if row[1] != "": |
48 | self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8") | 55 | self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8") |
49 | - | ||
50 | - #except: | ||
51 | - # print "Unexpected error:", sys.exc_info()[0] | 56 | + |
57 | + | ||
58 | + # Abre o arquivo que contem os tempos verbais | ||
59 | + def createDicTemVerbs(self): | ||
60 | + try: | ||
61 | + self.__fileTemVerbs = csv.reader(open(self.__path+"temposVerbais.csv"), delimiter=";") | ||
62 | + except IOError, (errno, strerror): | ||
63 | + print "I/O error(%s): %s" % (errno, strerror) | ||
64 | + print "createDicTemVerbs" | ||
65 | + | ||
66 | + for row in self.__fileTemVerbs: | ||
67 | + self.__dicTemVerbs[row[0].decode("utf-8")] = row[0].decode("utf-8") | ||
52 | 68 | ||
53 | # Abre o arquivo que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos | 69 | # Abre o arquivo que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos |
54 | def createDicWords(self): | 70 | def createDicWords(self): |
@@ -86,4 +102,8 @@ class WorkCSV(object): | @@ -86,4 +102,8 @@ class WorkCSV(object): | ||
86 | 102 | ||
87 | # Retorna o dicionario dos substantivos a serem analisados pelo simplificador | 103 | # Retorna o dicionario dos substantivos a serem analisados pelo simplificador |
88 | def getDic2Gen(self): | 104 | def getDic2Gen(self): |
89 | - return self.__dic2Gen | ||
90 | \ No newline at end of file | 105 | \ No newline at end of file |
106 | + return self.__dic2Gen | ||
107 | + | ||
108 | + # Retorna o dicionario dos tempos verbais | ||
109 | + def getDicTemVerbs(self): | ||
110 | + return self.__dicTemVerbs | ||
91 | \ No newline at end of file | 111 | \ No newline at end of file |