Renomeia as classes 'ConversorExtenso', 'LeitorDicionarios' e 'Tradutor'

Erickson Silva
1 parent 9ba27f83
Showing 8 changed files with 346 additions and 346 deletions Show diff stats
src/new/AplicaRegras.py
src/new/AplicaSinonimos.py
src/new/ConversorExtenso.py
src/new/ConverteExtenso.py
src/new/LeitorDicionarios.py
src/new/LerDicionarios.py
src/new/Tradutor.py
src/new/TraduzSentencas.py
@@ -10,10 +10,10 @@ from collections import deque
 import xml.etree.ElementTree as ET
 from os.path import expanduser
 import platform
-from LeitorDicionarios import *
+from LerDicionarios import *
 from Iterator import *
 from StringAux import *
-from ConversorExtenso import *
+from ConverteExtenso import *
  
 class AplicaRegras(object):
  
@@ -31,7 +31,7 @@ class AplicaRegras(object):
 		else:
 			return ET.parse(expanduser("~")+'/vlibras-translate/data/regras.xml').getroot()
  
-	def aplicarRegrasMorpho(self, lista):
+	def aplicarRegrasMorfo(self, lista):
  
 		self.__especificos = {"advt" : self.verificarAdvTempo, "v" : self.verificarVbInfinitivo, "x" : self.verificarPrepos, "c" : self.verificarSubs2Generos, "a" : self.verificarArtigo, "l" : self.verificarVbLigacao, "i": self.verificarAdvIntensidade, "vbi":"zero", "n":"zero", "abmn":"zero", "adji":"zero", "adjn":"zero", "advi":"zero"}
 		self.pularIteracoes = 0
@@ -8,7 +8,7 @@
  
 import os, csv, sys
 from nltk.tree import *
-from LeitorDicionarios import *
+from LerDicionarios import *
  
 class AplicaSinonimos(object):
  
@@ -1,150 +0,0 @@
-#!/usr/bin/python
-# -*- coding: utf-8 -*-
-
-#Autor: Erickson Silva 
-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
-
-#LAViD - Laboratório de Aplicações de Vídeo Digital
-
-import sys
-from unicodedata import normalize
-from Iterator import *
-
-num = {"zero":0, "um":1, "dois":2, "tres":3, "quatro":4, "cinco":5, "seis":6,
-"sete":7, "oito":8, "nove":9}
-
-und = {"mil":1000, "milhao":1000000, "bilhao":1000000000, "trilhao":1000000000000}
- 
-ext = [{"um":"1", "dois":"2", "tres":"3", "quatro":"4", "cinco":"5", "seis":"6",
-"sete":"7", "oito":"8", "nove":"9", "dez":"10", "onze":"11", "doze":"12",
-"treze":"13", "quatorze":"14", "quinze":"15", "dezesseis":"16", 
-"dezessete":"17", "dezoito":"18", "dezenove":"19"}, {"vinte":"2", "trinta":"3",
-"quarenta":"4", "cinquenta":"5", "sessenta":"6", "setenta":"7", "oitenta":"8",
-"noventa":"9"}, {"cento":"1", "cem":"1", "duzentos":"2", "trezentos":"3",
-"quatrocentos":"4", "quinhentos":"5", "seissentos":"6", "setessentos":"7",
-"oitocentos":"8", "novecentos":"9"}]
-
-unds = {"mil":"000", "milhao":"000000","milhoes":"000000", "bilhao":"000000000","bilhoes":"000000000", "trilhao":"000000000000", "trilhoes":"000000000000"}
-
-
-
-def oneDigit(x):
-	return ext[0][x]
-
-def twoDigit(x):
-	try:
-		return ext[1][x[0]]+ext[0][x[1]]
-	except:
-		return ext[1][x[0]]+"0"
-
-def threeDigit(x):
-	return ext[2][x[0]]+ext[1][x[1]]+ext[0][x[2]]     
-
-def extenso2(n):
-    sn = n.split(",")
-    size = len(sn)
-    firstWord = sn[0]
-    endWord = ""
-    numExt = ""
-
-    if(unds.has_key(sn[size-1])):
-    	size -= 1
-    	endWord = sn[size]
-    	del sn[size]
-
-    if(ext[0].has_key(firstWord)):
-    	numExt = oneDigit(firstWord)
-        
-    elif (ext[1].has_key(firstWord)):
-    	numExt = twoDigit(sn)
-
-    elif (ext[2].has_key(firstWord)):
-    	if(size == 1):
-    		numExt = ext[2][firstWord]+"00"
-    	elif (size == 2):
-    		if(sn[1] == "dez"):
-    			numExt = ext[2][firstWord]+oneDigit(sn[1])
-    		try:
-    			numExt = ext[2][firstWord]+"0"+oneDigit(sn[1])
-    		except:
-    			numExt = ext[2][firstWord]+twoDigit([sn[1]])
-    	else:
-	    	numExt = threeDigit(sn)
-
-    if(endWord != ""):
-    	numExt = numExt+unds[endWord]
-
-    return numExt 
-
-def extenso(extenso):
-	global newToken, auxToken
-	extensoQuebrado = extenso.lower().split(" ")
-	nums = []
-	it = Iterator()
-	it.load(extensoQuebrado)
-	while(it.hasNext()):
-		token = simplifica(it.getToken())
-		tokenAnterior = simplifica(it.getToken(-1))
-		if (und.has_key(token)):
-			#print "cond1"
-			if(it.getCount() == 0):
-				#print "cond2"
-				nums.append(und[token])
-			else:
-				#print "cond3"
-				newToken = und[token] * int(nums[-1])
-				nums[-1] = newToken
-		else:
-			#print "cond4"
-			if (num.has_key(token)):
-				#print "cond5"
-				auxToken = num[token]
-			elif (not und.has_key(token)):
-				#print "cond6"
-				auxToken = extenso2(token)
-				
-			if((not und.has_key(tokenAnterior)) and it.getCount() > 0):
-				#print "cond7"
-				newToken = int(auxToken) + int(nums[-1])
-				nums[-1] = newToken
-			else:
-				#print "cond8"
-				nums.append(auxToken)
-
-	return soma(nums)
-
-def soma(lista):
-	soma = 0
-	for i in lista:
-		soma += int(i)
-	return soma
-
-def simplifica(txt):
-
-	newToken = ""
-	try:
-		newToken = normalize('NFKD', txt.decode('utf-8')).encode('ASCII','ignore')
-	except:
-		newToken = normalize('NFKD', txt.decode('iso-8859-1')).encode('ASCII','ignore')
-
-	if(newToken[-3:] == "oes"): return newToken[:-3] + "ao"
-	return newToken
-
-'''
-if __name__ == '__main__':
-    n = sys.argv[1]
-    return extenso(n)
-    arquivoExts = open('exts', 'r')
-    listaExts = arquivoExts.readlines()
-    arquivoNums = open('nums', 'r')
-    listaNums = arquivoNums.readlines()
-    for i in range(0,500):
-    	n = listaNums[i].replace("\n","")
-    	e = listaExts[i].replace("\n","")
-        numNew = extenso(e)
-        if (str(numNew) != n):
-        	print n + " != " + str(numNew)
-        #else:
-        #	print "OK: " + n + " == " + str(numNew)
-'''
-
@@ -0,0 +1,150 @@
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+#Autor: Erickson Silva 
+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
+
+#LAViD - Laboratório de Aplicações de Vídeo Digital
+
+import sys
+from unicodedata import normalize
+from Iterator import *
+
+num = {"zero":0, "um":1, "dois":2, "tres":3, "quatro":4, "cinco":5, "seis":6,
+"sete":7, "oito":8, "nove":9}
+
+und = {"mil":1000, "milhao":1000000, "bilhao":1000000000, "trilhao":1000000000000}
+ 
+ext = [{"um":"1", "dois":"2", "tres":"3", "quatro":"4", "cinco":"5", "seis":"6",
+"sete":"7", "oito":"8", "nove":"9", "dez":"10", "onze":"11", "doze":"12",
+"treze":"13", "quatorze":"14", "quinze":"15", "dezesseis":"16", 
+"dezessete":"17", "dezoito":"18", "dezenove":"19"}, {"vinte":"2", "trinta":"3",
+"quarenta":"4", "cinquenta":"5", "sessenta":"6", "setenta":"7", "oitenta":"8",
+"noventa":"9"}, {"cento":"1", "cem":"1", "duzentos":"2", "trezentos":"3",
+"quatrocentos":"4", "quinhentos":"5", "seissentos":"6", "setessentos":"7",
+"oitocentos":"8", "novecentos":"9"}]
+
+unds = {"mil":"000", "milhao":"000000","milhoes":"000000", "bilhao":"000000000","bilhoes":"000000000", "trilhao":"000000000000", "trilhoes":"000000000000"}
+
+
+
+def oneDigit(x):
+	return ext[0][x]
+
+def twoDigit(x):
+	try:
+		return ext[1][x[0]]+ext[0][x[1]]
+	except:
+		return ext[1][x[0]]+"0"
+
+def threeDigit(x):
+	return ext[2][x[0]]+ext[1][x[1]]+ext[0][x[2]]     
+
+def extenso2(n):
+    sn = n.split(",")
+    size = len(sn)
+    firstWord = sn[0]
+    endWord = ""
+    numExt = ""
+
+    if(unds.has_key(sn[size-1])):
+    	size -= 1
+    	endWord = sn[size]
+    	del sn[size]
+
+    if(ext[0].has_key(firstWord)):
+    	numExt = oneDigit(firstWord)
+        
+    elif (ext[1].has_key(firstWord)):
+    	numExt = twoDigit(sn)
+
+    elif (ext[2].has_key(firstWord)):
+    	if(size == 1):
+    		numExt = ext[2][firstWord]+"00"
+    	elif (size == 2):
+    		if(sn[1] == "dez"):
+    			numExt = ext[2][firstWord]+oneDigit(sn[1])
+    		try:
+    			numExt = ext[2][firstWord]+"0"+oneDigit(sn[1])
+    		except:
+    			numExt = ext[2][firstWord]+twoDigit([sn[1]])
+    	else:
+	    	numExt = threeDigit(sn)
+
+    if(endWord != ""):
+    	numExt = numExt+unds[endWord]
+
+    return numExt 
+
+def extenso(extenso):
+	global newToken, auxToken
+	extensoQuebrado = extenso.lower().split(" ")
+	nums = []
+	it = Iterator()
+	it.load(extensoQuebrado)
+	while(it.hasNext()):
+		token = simplifica(it.getToken())
+		tokenAnterior = simplifica(it.getToken(-1))
+		if (und.has_key(token)):
+			#print "cond1"
+			if(it.getCount() == 0):
+				#print "cond2"
+				nums.append(und[token])
+			else:
+				#print "cond3"
+				newToken = und[token] * int(nums[-1])
+				nums[-1] = newToken
+		else:
+			#print "cond4"
+			if (num.has_key(token)):
+				#print "cond5"
+				auxToken = num[token]
+			elif (not und.has_key(token)):
+				#print "cond6"
+				auxToken = extenso2(token)
+				
+			if((not und.has_key(tokenAnterior)) and it.getCount() > 0):
+				#print "cond7"
+				newToken = int(auxToken) + int(nums[-1])
+				nums[-1] = newToken
+			else:
+				#print "cond8"
+				nums.append(auxToken)
+
+	return soma(nums)
+
+def soma(lista):
+	soma = 0
+	for i in lista:
+		soma += int(i)
+	return soma
+
+def simplifica(txt):
+
+	newToken = ""
+	try:
+		newToken = normalize('NFKD', txt.decode('utf-8')).encode('ASCII','ignore')
+	except:
+		newToken = normalize('NFKD', txt.decode('iso-8859-1')).encode('ASCII','ignore')
+
+	if(newToken[-3:] == "oes"): return newToken[:-3] + "ao"
+	return newToken
+
+'''
+if __name__ == '__main__':
+    n = sys.argv[1]
+    return extenso(n)
+    arquivoExts = open('exts', 'r')
+    listaExts = arquivoExts.readlines()
+    arquivoNums = open('nums', 'r')
+    listaNums = arquivoNums.readlines()
+    for i in range(0,500):
+    	n = listaNums[i].replace("\n","")
+    	e = listaExts[i].replace("\n","")
+        numNew = extenso(e)
+        if (str(numNew) != n):
+        	print n + " != " + str(numNew)
+        #else:
+        #	print "OK: " + n + " == " + str(numNew)
+'''
+
@@ -1,146 +0,0 @@
-#!/usr/bin/python
-# -*- coding: utf-8 -*-
-
-#Autor: Erickson Silva 
-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
-
-#LAViD - Laboratório de Aplicações de Vídeo Digital
-
-from os.path import expanduser
-import csv, platform
-
-class LeitorDicionarios(object):
-   #_iInstance = None
-
-   #class Singleton:
-   #     def __init__(self):
-   #        self.LeitorDicionarios = None
- 
-   #def __init__( self ):
-   #     if LeitorDicionarios._iInstance is None:
-   #         LeitorDicionarios._iInstance = LeitorDicionarios.Singleton()
- 
-   #     self._EventHandler_instance = LeitorDicionarios._iInstance
- 
-   #def __getattr__(self, aAttr):
-   #   return getattr(self._iInstance, aAttr)
-
-   #def __setattr__(self, aAttr, aValue):
-   #     return setattr(self._iInstance, aAttr, aValue)
-
-   # Define e inicializa os atributos
-   def __init__(self):
-
-      so = platform.system()
-      if so == 'Windows':
-         self.__path = expanduser("~") + "\\vlibras-translate\data\\"
-      else:
-         self.__path = expanduser("~") + "/vlibras-translate/data/"
-
-      self.__dicInf = {}
-      self.__dicSin = {}
-      self.__dicWords = {}
-      self.__dic2Gen = {}      
-      self.__dicTemVerbs = {}  
-      self.__fileDic = ''   
-      self.carregarVerbosInfinitivos()
-      self.carregarSinonimos()
-      self.carregarPalavrasIgnoradas()
-      self.carregarSubst2Generos()
-      self.carregarTemposVerbais() 
-
-   # Abre o self.__fileDic que contem os verbos no infinitivo e preenche o dicionario com os mesmos
-   def carregarVerbosInfinitivos(self):
-      try:
-         self.__fileDic = csv.reader(open(self.__path+"dicPortGlosa.csv"), delimiter=";")
-      except IOError, (errno, strerror): 
-         print "I/O error(%s): %s" % (errno, strerror)
-         print "carregarVerbosInfinitivos"
-
-      for row in self.__fileDic:
-         if row[1] != "": 
-            try:
-               self.__dicInf[row[0].decode("utf-8")] = row[1].decode("utf-8")  
-            except UnicodeDecodeError:
-               self.__dicInf[row[0].decode('iso8859-1').encode('utf-8')] = row[1].decode('iso8859-1').encode('utf-8')
-         
-   # Abre o self.__fileDic que contem os sinonimos e preenche o dicionario com os mesmos
-   def carregarSinonimos(self):
-      try:
-         self.__fileDic = csv.reader(open(self.__path+"portuguesGlosa.csv"), delimiter=";")
-      except IOError, (errno, strerror):
-         print "I/O error(%s): %s" % (errno, strerror)
-         print "carregarSinonimos"
-   
-      for row in self.__fileDic:
-         if row[1] != "":
-            self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8")
-    
-
-    # Abre o self.__fileDic que contem os tempos verbais
-   def carregarTemposVerbais(self):
-      try:
-         self.__fileDic = csv.reader(open(self.__path+"temposVerbais.csv"), delimiter=";")
-      except IOError, (errno, strerror):
-         print "I/O error(%s): %s" % (errno, strerror)
-         print "carregarTemposVerbais"
-         
-      for row in self.__fileDic:
-         self.__dicTemVerbs[row[0].decode("utf-8")] = row[0].decode("utf-8")     
-
-   # Abre o self.__fileDic que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos
-   def carregarPalavrasIgnoradas(self):
-      try:
-         self.__fileDic = csv.reader(open(self.__path+"hWordsRemove.csv"), delimiter=";")
-      except IOError, (errno, strerror):
-         print "I/O error(%s): %s" % (errno, strerror)
-         print "carregarPalavrasIgnoradas"
-
-      for row in self.__fileDic:
-         self.__dicWords[row[0].decode("utf-8")] = row[0].decode("utf-8")
-        
-   # Abre o self.__fileDic que contem os substantivos que sao comuns dos 2 generos e preenche o dicionario com os mesmos
-   def carregarSubst2Generos(self):
-      try:
-         self.__fileDic = csv.reader(open(self.__path+"subs2Generos.csv"), delimiter=";")
-      except IOError, (errno, strerror):
-         print "I/O error(%s): %s" % (errno, strerror)
-         print "carregarSubst2Generos" 
-           
-      for row in self.__fileDic:
-         self.__dic2Gen[row[0].decode("utf-8")] = row[0].decode("utf-8")    
-
-   # Retorna o dicionario dos verbos no infinitivo
-   def getVerboInfinitivo(self, token):
-      return self.__dicInf[token]
-
-   # Retorna o dicionario dos sinonimos
-   def getSinonimo(self, token):
-      return self.__dicSin[token]
-
-   # Retorna o dicionario dos artigos e preposicoes a serem removidos pelo simplificador
-   def getPalavraIgnorada(self, token):
-      return self.__dicWords[token]
-
-   # Retorna o dicionario dos substantivos a serem analisados pelo simplificador
-   def getSubst2Generos(self, token):
-      return self.__dic2Gen[token]
-
-   # Retorna o dicionario dos tempos verbais
-   def getTempoVerbal(self, token):
-      return self.__dicTemVerbs[token]  
-
-   def hasVerboInfinitivo(self, token):
-      return self.__dicInf.has_key(token)
-
-   def hasSinonimo(self, token):
-      return self.__dicSin.has_key(token)
-
-   def hasPalavraIgnorada(self, token):
-      return self.__dicWords.has_key(token)
-
-   def hasSubst2Genero(self, token):
-      return self.__dic2Gen.has_key(token)
-
-   def hasTempoVerbal(self, token):
-      return self.__dicTemVerbs.has_key(token)
@@ -0,0 +1,146 @@
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+#Autor: Erickson Silva 
+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
+
+#LAViD - Laboratório de Aplicações de Vídeo Digital
+
+from os.path import expanduser
+import csv, platform
+
+class LeitorDicionarios(object):
+   #_iInstance = None
+
+   #class Singleton:
+   #     def __init__(self):
+   #        self.LeitorDicionarios = None
+ 
+   #def __init__( self ):
+   #     if LeitorDicionarios._iInstance is None:
+   #         LeitorDicionarios._iInstance = LeitorDicionarios.Singleton()
+ 
+   #     self._EventHandler_instance = LeitorDicionarios._iInstance
+ 
+   #def __getattr__(self, aAttr):
+   #   return getattr(self._iInstance, aAttr)
+
+   #def __setattr__(self, aAttr, aValue):
+   #     return setattr(self._iInstance, aAttr, aValue)
+
+   # Define e inicializa os atributos
+   def __init__(self):
+
+      so = platform.system()
+      if so == 'Windows':
+         self.__path = expanduser("~") + "\\vlibras-translate\data\\"
+      else:
+         self.__path = expanduser("~") + "/vlibras-translate/data/"
+
+      self.__dicInf = {}
+      self.__dicSin = {}
+      self.__dicWords = {}
+      self.__dic2Gen = {}      
+      self.__dicTemVerbs = {}  
+      self.__fileDic = ''   
+      self.carregarVerbosInfinitivos()
+      self.carregarSinonimos()
+      self.carregarPalavrasIgnoradas()
+      self.carregarSubst2Generos()
+      self.carregarTemposVerbais() 
+
+   # Abre o self.__fileDic que contem os verbos no infinitivo e preenche o dicionario com os mesmos
+   def carregarVerbosInfinitivos(self):
+      try:
+         self.__fileDic = csv.reader(open(self.__path+"dicPortGlosa.csv"), delimiter=";")
+      except IOError, (errno, strerror): 
+         print "I/O error(%s): %s" % (errno, strerror)
+         print "carregarVerbosInfinitivos"
+
+      for row in self.__fileDic:
+         if row[1] != "": 
+            try:
+               self.__dicInf[row[0].decode("utf-8")] = row[1].decode("utf-8")  
+            except UnicodeDecodeError:
+               self.__dicInf[row[0].decode('iso8859-1').encode('utf-8')] = row[1].decode('iso8859-1').encode('utf-8')
+         
+   # Abre o self.__fileDic que contem os sinonimos e preenche o dicionario com os mesmos
+   def carregarSinonimos(self):
+      try:
+         self.__fileDic = csv.reader(open(self.__path+"portuguesGlosa.csv"), delimiter=";")
+      except IOError, (errno, strerror):
+         print "I/O error(%s): %s" % (errno, strerror)
+         print "carregarSinonimos"
+   
+      for row in self.__fileDic:
+         if row[1] != "":
+            self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8")
+    
+
+    # Abre o self.__fileDic que contem os tempos verbais
+   def carregarTemposVerbais(self):
+      try:
+         self.__fileDic = csv.reader(open(self.__path+"temposVerbais.csv"), delimiter=";")
+      except IOError, (errno, strerror):
+         print "I/O error(%s): %s" % (errno, strerror)
+         print "carregarTemposVerbais"
+         
+      for row in self.__fileDic:
+         self.__dicTemVerbs[row[0].decode("utf-8")] = row[0].decode("utf-8")     
+
+   # Abre o self.__fileDic que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos
+   def carregarPalavrasIgnoradas(self):
+      try:
+         self.__fileDic = csv.reader(open(self.__path+"hWordsRemove.csv"), delimiter=";")
+      except IOError, (errno, strerror):
+         print "I/O error(%s): %s" % (errno, strerror)
+         print "carregarPalavrasIgnoradas"
+
+      for row in self.__fileDic:
+         self.__dicWords[row[0].decode("utf-8")] = row[0].decode("utf-8")
+        
+   # Abre o self.__fileDic que contem os substantivos que sao comuns dos 2 generos e preenche o dicionario com os mesmos
+   def carregarSubst2Generos(self):
+      try:
+         self.__fileDic = csv.reader(open(self.__path+"subs2Generos.csv"), delimiter=";")
+      except IOError, (errno, strerror):
+         print "I/O error(%s): %s" % (errno, strerror)
+         print "carregarSubst2Generos" 
+           
+      for row in self.__fileDic:
+         self.__dic2Gen[row[0].decode("utf-8")] = row[0].decode("utf-8")    
+
+   # Retorna o dicionario dos verbos no infinitivo
+   def getVerboInfinitivo(self, token):
+      return self.__dicInf[token]
+
+   # Retorna o dicionario dos sinonimos
+   def getSinonimo(self, token):
+      return self.__dicSin[token]
+
+   # Retorna o dicionario dos artigos e preposicoes a serem removidos pelo simplificador
+   def getPalavraIgnorada(self, token):
+      return self.__dicWords[token]
+
+   # Retorna o dicionario dos substantivos a serem analisados pelo simplificador
+   def getSubst2Generos(self, token):
+      return self.__dic2Gen[token]
+
+   # Retorna o dicionario dos tempos verbais
+   def getTempoVerbal(self, token):
+      return self.__dicTemVerbs[token]  
+
+   def hasVerboInfinitivo(self, token):
+      return self.__dicInf.has_key(token)
+
+   def hasSinonimo(self, token):
+      return self.__dicSin.has_key(token)
+
+   def hasPalavraIgnorada(self, token):
+      return self.__dicWords.has_key(token)
+
+   def hasSubst2Genero(self, token):
+      return self.__dic2Gen.has_key(token)
+
+   def hasTempoVerbal(self, token):
+      return self.__dicTemVerbs.has_key(token)
@@ -1,46 +0,0 @@
-#!/usr/bin/python
-# -*- coding: utf-8 -*-
-
-#Autor: Erickson Silva 
-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
-
-#LAViD - Laboratório de Aplicações de Vídeo Digital
-
-import alexp
-from AplicaSinonimos import *
-from AplicaRegras import * 
-
-aplicaSinonimos = AplicaSinonimos()
-aplicaRegras = AplicaRegras()
-
-
-def iniciarTraducao(texto):
-	textoDividido = texto.split(".")
-	for w in textoDividido:
-		if len(w) > 0 and w != " ":
-			return gerarAnalise(w)
-
-
-def gerarAnalise(sentenca):
-	'''tokens = alexp.toqueniza(sentenca)
-	etiquetadas = alexp.etiquetaSentenca(tokens)
-	analiseMorf = analiseMorfologica(etiquetadas)
-	print analiseMorf'''
-
-	sintatica = alexp.run(sentenca)
-	morfologica = alexp.getAnaliseMorfologica()
-
-	if (isinstance(sintatica,type(None))):
-		return analiseMorfologica(morfologica)
-	else:
-		print analiseSintatica(sintatica, morfologica)
-		
-
-def analiseMorfologica(listaMorfologica):
-	proc = aplicaRegras.aplicarRegrasMorfo(listaMorfologica)
-	return aplicaSinonimos.sinonimosMorfologico(proc)
-
-        
-def analiseSintatica(arvoreSintatica, listaMorfologica):
-	proc = aplicaRegras.aplicarRegrasSint(arvoreSintatica, listaMorfologica)
-	return aplicaSinonimos.sinonimosSintatico(proc)
 \ No newline at end of file
@@ -0,0 +1,46 @@
+#!/usr/bin/python
+# -*- coding: utf-8 -*-
+
+#Autor: Erickson Silva 
+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
+
+#LAViD - Laboratório de Aplicações de Vídeo Digital
+
+import alexp
+from AplicaSinonimos import *
+from AplicaRegras import * 
+
+aplicaSinonimos = AplicaSinonimos()
+aplicaRegras = AplicaRegras()
+
+
+def iniciarTraducao(texto):
+	textoDividido = texto.split(".")
+	for w in textoDividido:
+		if len(w) > 0 and w != " ":
+			return gerarAnalise(w)
+
+
+def gerarAnalise(sentenca):
+	'''tokens = alexp.toqueniza(sentenca)
+	etiquetadas = alexp.etiquetaSentenca(tokens)
+	analiseMorf = analiseMorfologica(etiquetadas)
+	print analiseMorf'''
+
+	sintatica = alexp.run(sentenca)
+	morfologica = alexp.getAnaliseMorfologica()
+
+	if (isinstance(sintatica,type(None))):
+		return analiseMorfologica(morfologica)
+	else:
+		print analiseSintatica(sintatica, morfologica)
+		
+
+def analiseMorfologica(listaMorfologica):
+	proc = aplicaRegras.aplicarRegrasMorfo(listaMorfologica)
+	return aplicaSinonimos.sinonimosMorfologico(proc)
+
+        
+def analiseSintatica(arvoreSintatica, listaMorfologica):
+	proc = aplicaRegras.aplicarRegrasSint(arvoreSintatica, listaMorfologica)
+	return aplicaSinonimos.sinonimosSintatico(proc)
 \ No newline at end of file
...	...	@@ -10,10 +10,10 @@ from collections import deque
10	10	import xml.etree.ElementTree as ET
11	11	from os.path import expanduser
12	12	import platform
13		-from LeitorDicionarios import *
	13	+from LerDicionarios import *
14	14	from Iterator import *
15	15	from StringAux import *
16		-from ConversorExtenso import *
	16	+from ConverteExtenso import *
17	17
18	18	class AplicaRegras(object):
19	19
...	...	@@ -31,7 +31,7 @@ class AplicaRegras(object):
31	31	else:
32	32	return ET.parse(expanduser("~")+'/vlibras-translate/data/regras.xml').getroot()
33	33
34		- def aplicarRegrasMorpho(self, lista):
	34	+ def aplicarRegrasMorfo(self, lista):
35	35
36	36	self.__especificos = {"advt" : self.verificarAdvTempo, "v" : self.verificarVbInfinitivo, "x" : self.verificarPrepos, "c" : self.verificarSubs2Generos, "a" : self.verificarArtigo, "l" : self.verificarVbLigacao, "i": self.verificarAdvIntensidade, "vbi":"zero", "n":"zero", "abmn":"zero", "adji":"zero", "adjn":"zero", "advi":"zero"}
37	37	self.pularIteracoes = 0
...	...
...	...	@@ -8,7 +8,7 @@
8	8
9	9	import os, csv, sys
10	10	from nltk.tree import *
11		-from LeitorDicionarios import *
	11	+from LerDicionarios import *
12	12
13	13	class AplicaSinonimos(object):
14	14
...	...
...	...	@@ -1,150 +0,0 @@
1		-#!/usr/bin/python
2		-# -- coding: utf-8 --
3		-
4		-#Autor: Erickson Silva
5		-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
6		-
7		-#LAViD - Laboratório de Aplicações de Vídeo Digital
8		-
9		-import sys
10		-from unicodedata import normalize
11		-from Iterator import *
12		-
13		-num = {"zero":0, "um":1, "dois":2, "tres":3, "quatro":4, "cinco":5, "seis":6,
14		-"sete":7, "oito":8, "nove":9}
15		-
16		-und = {"mil":1000, "milhao":1000000, "bilhao":1000000000, "trilhao":1000000000000}
17		-
18		-ext = [{"um":"1", "dois":"2", "tres":"3", "quatro":"4", "cinco":"5", "seis":"6",
19		-"sete":"7", "oito":"8", "nove":"9", "dez":"10", "onze":"11", "doze":"12",
20		-"treze":"13", "quatorze":"14", "quinze":"15", "dezesseis":"16",
21		-"dezessete":"17", "dezoito":"18", "dezenove":"19"}, {"vinte":"2", "trinta":"3",
22		-"quarenta":"4", "cinquenta":"5", "sessenta":"6", "setenta":"7", "oitenta":"8",
23		-"noventa":"9"}, {"cento":"1", "cem":"1", "duzentos":"2", "trezentos":"3",
24		-"quatrocentos":"4", "quinhentos":"5", "seissentos":"6", "setessentos":"7",
25		-"oitocentos":"8", "novecentos":"9"}]
26		-
27		-unds = {"mil":"000", "milhao":"000000","milhoes":"000000", "bilhao":"000000000","bilhoes":"000000000", "trilhao":"000000000000", "trilhoes":"000000000000"}
28		-
29		-
30		-
31		-def oneDigit(x):
32		- return ext[0][x]
33		-
34		-def twoDigit(x):
35		- try:
36		- return ext[1][x[0]]+ext[0][x[1]]
37		- except:
38		- return ext[1][x[0]]+"0"
39		-
40		-def threeDigit(x):
41		- return ext[2][x[0]]+ext[1][x[1]]+ext[0][x[2]]
42		-
43		-def extenso2(n):
44		- sn = n.split(",")
45		- size = len(sn)
46		- firstWord = sn[0]
47		- endWord = ""
48		- numExt = ""
49		-
50		- if(unds.has_key(sn[size-1])):
51		- size -= 1
52		- endWord = sn[size]
53		- del sn[size]
54		-
55		- if(ext[0].has_key(firstWord)):
56		- numExt = oneDigit(firstWord)
57		-
58		- elif (ext[1].has_key(firstWord)):
59		- numExt = twoDigit(sn)
60		-
61		- elif (ext[2].has_key(firstWord)):
62		- if(size == 1):
63		- numExt = ext[2][firstWord]+"00"
64		- elif (size == 2):
65		- if(sn[1] == "dez"):
66		- numExt = ext[2][firstWord]+oneDigit(sn[1])
67		- try:
68		- numExt = ext[2][firstWord]+"0"+oneDigit(sn[1])
69		- except:
70		- numExt = ext[2][firstWord]+twoDigit([sn[1]])
71		- else:
72		- numExt = threeDigit(sn)
73		-
74		- if(endWord != ""):
75		- numExt = numExt+unds[endWord]
76		-
77		- return numExt
78		-
79		-def extenso(extenso):
80		- global newToken, auxToken
81		- extensoQuebrado = extenso.lower().split(" ")
82		- nums = []
83		- it = Iterator()
84		- it.load(extensoQuebrado)
85		- while(it.hasNext()):
86		- token = simplifica(it.getToken())
87		- tokenAnterior = simplifica(it.getToken(-1))
88		- if (und.has_key(token)):
89		- #print "cond1"
90		- if(it.getCount() == 0):
91		- #print "cond2"
92		- nums.append(und[token])
93		- else:
94		- #print "cond3"
95		- newToken = und[token] * int(nums[-1])
96		- nums[-1] = newToken
97		- else:
98		- #print "cond4"
99		- if (num.has_key(token)):
100		- #print "cond5"
101		- auxToken = num[token]
102		- elif (not und.has_key(token)):
103		- #print "cond6"
104		- auxToken = extenso2(token)
105		-
106		- if((not und.has_key(tokenAnterior)) and it.getCount() > 0):
107		- #print "cond7"
108		- newToken = int(auxToken) + int(nums[-1])
109		- nums[-1] = newToken
110		- else:
111		- #print "cond8"
112		- nums.append(auxToken)
113		-
114		- return soma(nums)
115		-
116		-def soma(lista):
117		- soma = 0
118		- for i in lista:
119		- soma += int(i)
120		- return soma
121		-
122		-def simplifica(txt):
123		-
124		- newToken = ""
125		- try:
126		- newToken = normalize('NFKD', txt.decode('utf-8')).encode('ASCII','ignore')
127		- except:
128		- newToken = normalize('NFKD', txt.decode('iso-8859-1')).encode('ASCII','ignore')
129		-
130		- if(newToken[-3:] == "oes"): return newToken[:-3] + "ao"
131		- return newToken
132		-
133		-'''
134		-if __name__ == '__main__':
135		- n = sys.argv[1]
136		- return extenso(n)
137		- arquivoExts = open('exts', 'r')
138		- listaExts = arquivoExts.readlines()
139		- arquivoNums = open('nums', 'r')
140		- listaNums = arquivoNums.readlines()
141		- for i in range(0,500):
142		- n = listaNums[i].replace("\n","")
143		- e = listaExts[i].replace("\n","")
144		- numNew = extenso(e)
145		- if (str(numNew) != n):
146		- print n + " != " + str(numNew)
147		- #else:
148		- # print "OK: " + n + " == " + str(numNew)
149		-'''
150		-
...	...	@@ -0,0 +1,150 @@
	1	+#!/usr/bin/python
	2	+# -- coding: utf-8 --
	3	+
	4	+#Autor: Erickson Silva
	5	+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
	6	+
	7	+#LAViD - Laboratório de Aplicações de Vídeo Digital
	8	+
	9	+import sys
	10	+from unicodedata import normalize
	11	+from Iterator import *
	12	+
	13	+num = {"zero":0, "um":1, "dois":2, "tres":3, "quatro":4, "cinco":5, "seis":6,
	14	+"sete":7, "oito":8, "nove":9}
	15	+
	16	+und = {"mil":1000, "milhao":1000000, "bilhao":1000000000, "trilhao":1000000000000}
	17	+
	18	+ext = [{"um":"1", "dois":"2", "tres":"3", "quatro":"4", "cinco":"5", "seis":"6",
	19	+"sete":"7", "oito":"8", "nove":"9", "dez":"10", "onze":"11", "doze":"12",
	20	+"treze":"13", "quatorze":"14", "quinze":"15", "dezesseis":"16",
	21	+"dezessete":"17", "dezoito":"18", "dezenove":"19"}, {"vinte":"2", "trinta":"3",
	22	+"quarenta":"4", "cinquenta":"5", "sessenta":"6", "setenta":"7", "oitenta":"8",
	23	+"noventa":"9"}, {"cento":"1", "cem":"1", "duzentos":"2", "trezentos":"3",
	24	+"quatrocentos":"4", "quinhentos":"5", "seissentos":"6", "setessentos":"7",
	25	+"oitocentos":"8", "novecentos":"9"}]
	26	+
	27	+unds = {"mil":"000", "milhao":"000000","milhoes":"000000", "bilhao":"000000000","bilhoes":"000000000", "trilhao":"000000000000", "trilhoes":"000000000000"}
	28	+
	29	+
	30	+
	31	+def oneDigit(x):
	32	+ return ext[0][x]
	33	+
	34	+def twoDigit(x):
	35	+ try:
	36	+ return ext[1][x[0]]+ext[0][x[1]]
	37	+ except:
	38	+ return ext[1][x[0]]+"0"
	39	+
	40	+def threeDigit(x):
	41	+ return ext[2][x[0]]+ext[1][x[1]]+ext[0][x[2]]
	42	+
	43	+def extenso2(n):
	44	+ sn = n.split(",")
	45	+ size = len(sn)
	46	+ firstWord = sn[0]
	47	+ endWord = ""
	48	+ numExt = ""
	49	+
	50	+ if(unds.has_key(sn[size-1])):
	51	+ size -= 1
	52	+ endWord = sn[size]
	53	+ del sn[size]
	54	+
	55	+ if(ext[0].has_key(firstWord)):
	56	+ numExt = oneDigit(firstWord)
	57	+
	58	+ elif (ext[1].has_key(firstWord)):
	59	+ numExt = twoDigit(sn)
	60	+
	61	+ elif (ext[2].has_key(firstWord)):
	62	+ if(size == 1):
	63	+ numExt = ext[2][firstWord]+"00"
	64	+ elif (size == 2):
	65	+ if(sn[1] == "dez"):
	66	+ numExt = ext[2][firstWord]+oneDigit(sn[1])
	67	+ try:
	68	+ numExt = ext[2][firstWord]+"0"+oneDigit(sn[1])
	69	+ except:
	70	+ numExt = ext[2][firstWord]+twoDigit([sn[1]])
	71	+ else:
	72	+ numExt = threeDigit(sn)
	73	+
	74	+ if(endWord != ""):
	75	+ numExt = numExt+unds[endWord]
	76	+
	77	+ return numExt
	78	+
	79	+def extenso(extenso):
	80	+ global newToken, auxToken
	81	+ extensoQuebrado = extenso.lower().split(" ")
	82	+ nums = []
	83	+ it = Iterator()
	84	+ it.load(extensoQuebrado)
	85	+ while(it.hasNext()):
	86	+ token = simplifica(it.getToken())
	87	+ tokenAnterior = simplifica(it.getToken(-1))
	88	+ if (und.has_key(token)):
	89	+ #print "cond1"
	90	+ if(it.getCount() == 0):
	91	+ #print "cond2"
	92	+ nums.append(und[token])
	93	+ else:
	94	+ #print "cond3"
	95	+ newToken = und[token] * int(nums[-1])
	96	+ nums[-1] = newToken
	97	+ else:
	98	+ #print "cond4"
	99	+ if (num.has_key(token)):
	100	+ #print "cond5"
	101	+ auxToken = num[token]
	102	+ elif (not und.has_key(token)):
	103	+ #print "cond6"
	104	+ auxToken = extenso2(token)
	105	+
	106	+ if((not und.has_key(tokenAnterior)) and it.getCount() > 0):
	107	+ #print "cond7"
	108	+ newToken = int(auxToken) + int(nums[-1])
	109	+ nums[-1] = newToken
	110	+ else:
	111	+ #print "cond8"
	112	+ nums.append(auxToken)
	113	+
	114	+ return soma(nums)
	115	+
	116	+def soma(lista):
	117	+ soma = 0
	118	+ for i in lista:
	119	+ soma += int(i)
	120	+ return soma
	121	+
	122	+def simplifica(txt):
	123	+
	124	+ newToken = ""
	125	+ try:
	126	+ newToken = normalize('NFKD', txt.decode('utf-8')).encode('ASCII','ignore')
	127	+ except:
	128	+ newToken = normalize('NFKD', txt.decode('iso-8859-1')).encode('ASCII','ignore')
	129	+
	130	+ if(newToken[-3:] == "oes"): return newToken[:-3] + "ao"
	131	+ return newToken
	132	+
	133	+'''
	134	+if __name__ == '__main__':
	135	+ n = sys.argv[1]
	136	+ return extenso(n)
	137	+ arquivoExts = open('exts', 'r')
	138	+ listaExts = arquivoExts.readlines()
	139	+ arquivoNums = open('nums', 'r')
	140	+ listaNums = arquivoNums.readlines()
	141	+ for i in range(0,500):
	142	+ n = listaNums[i].replace("\n","")
	143	+ e = listaExts[i].replace("\n","")
	144	+ numNew = extenso(e)
	145	+ if (str(numNew) != n):
	146	+ print n + " != " + str(numNew)
	147	+ #else:
	148	+ # print "OK: " + n + " == " + str(numNew)
	149	+'''
	150	+
...	...
...	...	@@ -1,146 +0,0 @@
1		-#!/usr/bin/python
2		-# -- coding: utf-8 --
3		-
4		-#Autor: Erickson Silva
5		-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
6		-
7		-#LAViD - Laboratório de Aplicações de Vídeo Digital
8		-
9		-from os.path import expanduser
10		-import csv, platform
11		-
12		-class LeitorDicionarios(object):
13		- #_iInstance = None
14		-
15		- #class Singleton:
16		- # def __init__(self):
17		- # self.LeitorDicionarios = None
18		-
19		- #def __init__( self ):
20		- # if LeitorDicionarios._iInstance is None:
21		- # LeitorDicionarios._iInstance = LeitorDicionarios.Singleton()
22		-
23		- # self._EventHandler_instance = LeitorDicionarios._iInstance
24		-
25		- #def __getattr__(self, aAttr):
26		- # return getattr(self._iInstance, aAttr)
27		-
28		- #def __setattr__(self, aAttr, aValue):
29		- # return setattr(self._iInstance, aAttr, aValue)
30		-
31		- # Define e inicializa os atributos
32		- def __init__(self):
33		-
34		- so = platform.system()
35		- if so == 'Windows':
36		- self.__path = expanduser("~") + "\\vlibras-translate\data\\"
37		- else:
38		- self.__path = expanduser("~") + "/vlibras-translate/data/"
39		-
40		- self.__dicInf = {}
41		- self.__dicSin = {}
42		- self.__dicWords = {}
43		- self.__dic2Gen = {}
44		- self.__dicTemVerbs = {}
45		- self.__fileDic = ''
46		- self.carregarVerbosInfinitivos()
47		- self.carregarSinonimos()
48		- self.carregarPalavrasIgnoradas()
49		- self.carregarSubst2Generos()
50		- self.carregarTemposVerbais()
51		-
52		- # Abre o self.__fileDic que contem os verbos no infinitivo e preenche o dicionario com os mesmos
53		- def carregarVerbosInfinitivos(self):
54		- try:
55		- self.__fileDic = csv.reader(open(self.__path+"dicPortGlosa.csv"), delimiter=";")
56		- except IOError, (errno, strerror):
57		- print "I/O error(%s): %s" % (errno, strerror)
58		- print "carregarVerbosInfinitivos"
59		-
60		- for row in self.__fileDic:
61		- if row[1] != "":
62		- try:
63		- self.__dicInf[row[0].decode("utf-8")] = row[1].decode("utf-8")
64		- except UnicodeDecodeError:
65		- self.__dicInf[row[0].decode('iso8859-1').encode('utf-8')] = row[1].decode('iso8859-1').encode('utf-8')
66		-
67		- # Abre o self.__fileDic que contem os sinonimos e preenche o dicionario com os mesmos
68		- def carregarSinonimos(self):
69		- try:
70		- self.__fileDic = csv.reader(open(self.__path+"portuguesGlosa.csv"), delimiter=";")
71		- except IOError, (errno, strerror):
72		- print "I/O error(%s): %s" % (errno, strerror)
73		- print "carregarSinonimos"
74		-
75		- for row in self.__fileDic:
76		- if row[1] != "":
77		- self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8")
78		-
79		-
80		- # Abre o self.__fileDic que contem os tempos verbais
81		- def carregarTemposVerbais(self):
82		- try:
83		- self.__fileDic = csv.reader(open(self.__path+"temposVerbais.csv"), delimiter=";")
84		- except IOError, (errno, strerror):
85		- print "I/O error(%s): %s" % (errno, strerror)
86		- print "carregarTemposVerbais"
87		-
88		- for row in self.__fileDic:
89		- self.__dicTemVerbs[row[0].decode("utf-8")] = row[0].decode("utf-8")
90		-
91		- # Abre o self.__fileDic que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos
92		- def carregarPalavrasIgnoradas(self):
93		- try:
94		- self.__fileDic = csv.reader(open(self.__path+"hWordsRemove.csv"), delimiter=";")
95		- except IOError, (errno, strerror):
96		- print "I/O error(%s): %s" % (errno, strerror)
97		- print "carregarPalavrasIgnoradas"
98		-
99		- for row in self.__fileDic:
100		- self.__dicWords[row[0].decode("utf-8")] = row[0].decode("utf-8")
101		-
102		- # Abre o self.__fileDic que contem os substantivos que sao comuns dos 2 generos e preenche o dicionario com os mesmos
103		- def carregarSubst2Generos(self):
104		- try:
105		- self.__fileDic = csv.reader(open(self.__path+"subs2Generos.csv"), delimiter=";")
106		- except IOError, (errno, strerror):
107		- print "I/O error(%s): %s" % (errno, strerror)
108		- print "carregarSubst2Generos"
109		-
110		- for row in self.__fileDic:
111		- self.__dic2Gen[row[0].decode("utf-8")] = row[0].decode("utf-8")
112		-
113		- # Retorna o dicionario dos verbos no infinitivo
114		- def getVerboInfinitivo(self, token):
115		- return self.__dicInf[token]
116		-
117		- # Retorna o dicionario dos sinonimos
118		- def getSinonimo(self, token):
119		- return self.__dicSin[token]
120		-
121		- # Retorna o dicionario dos artigos e preposicoes a serem removidos pelo simplificador
122		- def getPalavraIgnorada(self, token):
123		- return self.__dicWords[token]
124		-
125		- # Retorna o dicionario dos substantivos a serem analisados pelo simplificador
126		- def getSubst2Generos(self, token):
127		- return self.__dic2Gen[token]
128		-
129		- # Retorna o dicionario dos tempos verbais
130		- def getTempoVerbal(self, token):
131		- return self.__dicTemVerbs[token]
132		-
133		- def hasVerboInfinitivo(self, token):
134		- return self.__dicInf.has_key(token)
135		-
136		- def hasSinonimo(self, token):
137		- return self.__dicSin.has_key(token)
138		-
139		- def hasPalavraIgnorada(self, token):
140		- return self.__dicWords.has_key(token)
141		-
142		- def hasSubst2Genero(self, token):
143		- return self.__dic2Gen.has_key(token)
144		-
145		- def hasTempoVerbal(self, token):
146		- return self.__dicTemVerbs.has_key(token)
...	...	@@ -0,0 +1,146 @@
	1	+#!/usr/bin/python
	2	+# -- coding: utf-8 --
	3	+
	4	+#Autor: Erickson Silva
	5	+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
	6	+
	7	+#LAViD - Laboratório de Aplicações de Vídeo Digital
	8	+
	9	+from os.path import expanduser
	10	+import csv, platform
	11	+
	12	+class LeitorDicionarios(object):
	13	+ #_iInstance = None
	14	+
	15	+ #class Singleton:
	16	+ # def __init__(self):
	17	+ # self.LeitorDicionarios = None
	18	+
	19	+ #def __init__( self ):
	20	+ # if LeitorDicionarios._iInstance is None:
	21	+ # LeitorDicionarios._iInstance = LeitorDicionarios.Singleton()
	22	+
	23	+ # self._EventHandler_instance = LeitorDicionarios._iInstance
	24	+
	25	+ #def __getattr__(self, aAttr):
	26	+ # return getattr(self._iInstance, aAttr)
	27	+
	28	+ #def __setattr__(self, aAttr, aValue):
	29	+ # return setattr(self._iInstance, aAttr, aValue)
	30	+
	31	+ # Define e inicializa os atributos
	32	+ def __init__(self):
	33	+
	34	+ so = platform.system()
	35	+ if so == 'Windows':
	36	+ self.__path = expanduser("~") + "\\vlibras-translate\data\\"
	37	+ else:
	38	+ self.__path = expanduser("~") + "/vlibras-translate/data/"
	39	+
	40	+ self.__dicInf = {}
	41	+ self.__dicSin = {}
	42	+ self.__dicWords = {}
	43	+ self.__dic2Gen = {}
	44	+ self.__dicTemVerbs = {}
	45	+ self.__fileDic = ''
	46	+ self.carregarVerbosInfinitivos()
	47	+ self.carregarSinonimos()
	48	+ self.carregarPalavrasIgnoradas()
	49	+ self.carregarSubst2Generos()
	50	+ self.carregarTemposVerbais()
	51	+
	52	+ # Abre o self.__fileDic que contem os verbos no infinitivo e preenche o dicionario com os mesmos
	53	+ def carregarVerbosInfinitivos(self):
	54	+ try:
	55	+ self.__fileDic = csv.reader(open(self.__path+"dicPortGlosa.csv"), delimiter=";")
	56	+ except IOError, (errno, strerror):
	57	+ print "I/O error(%s): %s" % (errno, strerror)
	58	+ print "carregarVerbosInfinitivos"
	59	+
	60	+ for row in self.__fileDic:
	61	+ if row[1] != "":
	62	+ try:
	63	+ self.__dicInf[row[0].decode("utf-8")] = row[1].decode("utf-8")
	64	+ except UnicodeDecodeError:
	65	+ self.__dicInf[row[0].decode('iso8859-1').encode('utf-8')] = row[1].decode('iso8859-1').encode('utf-8')
	66	+
	67	+ # Abre o self.__fileDic que contem os sinonimos e preenche o dicionario com os mesmos
	68	+ def carregarSinonimos(self):
	69	+ try:
	70	+ self.__fileDic = csv.reader(open(self.__path+"portuguesGlosa.csv"), delimiter=";")
	71	+ except IOError, (errno, strerror):
	72	+ print "I/O error(%s): %s" % (errno, strerror)
	73	+ print "carregarSinonimos"
	74	+
	75	+ for row in self.__fileDic:
	76	+ if row[1] != "":
	77	+ self.__dicSin[row[0].decode("utf-8")] = row[1].decode("utf-8")
	78	+
	79	+
	80	+ # Abre o self.__fileDic que contem os tempos verbais
	81	+ def carregarTemposVerbais(self):
	82	+ try:
	83	+ self.__fileDic = csv.reader(open(self.__path+"temposVerbais.csv"), delimiter=";")
	84	+ except IOError, (errno, strerror):
	85	+ print "I/O error(%s): %s" % (errno, strerror)
	86	+ print "carregarTemposVerbais"
	87	+
	88	+ for row in self.__fileDic:
	89	+ self.__dicTemVerbs[row[0].decode("utf-8")] = row[0].decode("utf-8")
	90	+
	91	+ # Abre o self.__fileDic que contem os artigos e preposicoes de acordo com o modelo de idioma passado na chamada e preenche o dicionario com os mesmos
	92	+ def carregarPalavrasIgnoradas(self):
	93	+ try:
	94	+ self.__fileDic = csv.reader(open(self.__path+"hWordsRemove.csv"), delimiter=";")
	95	+ except IOError, (errno, strerror):
	96	+ print "I/O error(%s): %s" % (errno, strerror)
	97	+ print "carregarPalavrasIgnoradas"
	98	+
	99	+ for row in self.__fileDic:
	100	+ self.__dicWords[row[0].decode("utf-8")] = row[0].decode("utf-8")
	101	+
	102	+ # Abre o self.__fileDic que contem os substantivos que sao comuns dos 2 generos e preenche o dicionario com os mesmos
	103	+ def carregarSubst2Generos(self):
	104	+ try:
	105	+ self.__fileDic = csv.reader(open(self.__path+"subs2Generos.csv"), delimiter=";")
	106	+ except IOError, (errno, strerror):
	107	+ print "I/O error(%s): %s" % (errno, strerror)
	108	+ print "carregarSubst2Generos"
	109	+
	110	+ for row in self.__fileDic:
	111	+ self.__dic2Gen[row[0].decode("utf-8")] = row[0].decode("utf-8")
	112	+
	113	+ # Retorna o dicionario dos verbos no infinitivo
	114	+ def getVerboInfinitivo(self, token):
	115	+ return self.__dicInf[token]
	116	+
	117	+ # Retorna o dicionario dos sinonimos
	118	+ def getSinonimo(self, token):
	119	+ return self.__dicSin[token]
	120	+
	121	+ # Retorna o dicionario dos artigos e preposicoes a serem removidos pelo simplificador
	122	+ def getPalavraIgnorada(self, token):
	123	+ return self.__dicWords[token]
	124	+
	125	+ # Retorna o dicionario dos substantivos a serem analisados pelo simplificador
	126	+ def getSubst2Generos(self, token):
	127	+ return self.__dic2Gen[token]
	128	+
	129	+ # Retorna o dicionario dos tempos verbais
	130	+ def getTempoVerbal(self, token):
	131	+ return self.__dicTemVerbs[token]
	132	+
	133	+ def hasVerboInfinitivo(self, token):
	134	+ return self.__dicInf.has_key(token)
	135	+
	136	+ def hasSinonimo(self, token):
	137	+ return self.__dicSin.has_key(token)
	138	+
	139	+ def hasPalavraIgnorada(self, token):
	140	+ return self.__dicWords.has_key(token)
	141	+
	142	+ def hasSubst2Genero(self, token):
	143	+ return self.__dic2Gen.has_key(token)
	144	+
	145	+ def hasTempoVerbal(self, token):
	146	+ return self.__dicTemVerbs.has_key(token)
...	...
...	...	@@ -1,46 +0,0 @@
1		-#!/usr/bin/python
2		-# -- coding: utf-8 --
3		-
4		-#Autor: Erickson Silva
5		-#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
6		-
7		-#LAViD - Laboratório de Aplicações de Vídeo Digital
8		-
9		-import alexp
10		-from AplicaSinonimos import *
11		-from AplicaRegras import *
12		-
13		-aplicaSinonimos = AplicaSinonimos()
14		-aplicaRegras = AplicaRegras()
15		-
16		-
17		-def iniciarTraducao(texto):
18		- textoDividido = texto.split(".")
19		- for w in textoDividido:
20		- if len(w) > 0 and w != " ":
21		- return gerarAnalise(w)
22		-
23		-
24		-def gerarAnalise(sentenca):
25		- '''tokens = alexp.toqueniza(sentenca)
26		- etiquetadas = alexp.etiquetaSentenca(tokens)
27		- analiseMorf = analiseMorfologica(etiquetadas)
28		- print analiseMorf'''
29		-
30		- sintatica = alexp.run(sentenca)
31		- morfologica = alexp.getAnaliseMorfologica()
32		-
33		- if (isinstance(sintatica,type(None))):
34		- return analiseMorfologica(morfologica)
35		- else:
36		- print analiseSintatica(sintatica, morfologica)
37		-
38		-
39		-def analiseMorfologica(listaMorfologica):
40		- proc = aplicaRegras.aplicarRegrasMorfo(listaMorfologica)
41		- return aplicaSinonimos.sinonimosMorfologico(proc)
42		-
43		-
44		-def analiseSintatica(arvoreSintatica, listaMorfologica):
45		- proc = aplicaRegras.aplicarRegrasSint(arvoreSintatica, listaMorfologica)
46		- return aplicaSinonimos.sinonimosSintatico(proc)
47	0	\ No newline at end of file
...	...	@@ -0,0 +1,46 @@
	1	+#!/usr/bin/python
	2	+# -- coding: utf-8 --
	3	+
	4	+#Autor: Erickson Silva
	5	+#Email: <erickson.silva@lavid.ufpb.br> <ericksonsilva@live.com>
	6	+
	7	+#LAViD - Laboratório de Aplicações de Vídeo Digital
	8	+
	9	+import alexp
	10	+from AplicaSinonimos import *
	11	+from AplicaRegras import *
	12	+
	13	+aplicaSinonimos = AplicaSinonimos()
	14	+aplicaRegras = AplicaRegras()
	15	+
	16	+
	17	+def iniciarTraducao(texto):
	18	+ textoDividido = texto.split(".")
	19	+ for w in textoDividido:
	20	+ if len(w) > 0 and w != " ":
	21	+ return gerarAnalise(w)
	22	+
	23	+
	24	+def gerarAnalise(sentenca):
	25	+ '''tokens = alexp.toqueniza(sentenca)
	26	+ etiquetadas = alexp.etiquetaSentenca(tokens)
	27	+ analiseMorf = analiseMorfologica(etiquetadas)
	28	+ print analiseMorf'''
	29	+
	30	+ sintatica = alexp.run(sentenca)
	31	+ morfologica = alexp.getAnaliseMorfologica()
	32	+
	33	+ if (isinstance(sintatica,type(None))):
	34	+ return analiseMorfologica(morfologica)
	35	+ else:
	36	+ print analiseSintatica(sintatica, morfologica)
	37	+
	38	+
	39	+def analiseMorfologica(listaMorfologica):
	40	+ proc = aplicaRegras.aplicarRegrasMorfo(listaMorfologica)
	41	+ return aplicaSinonimos.sinonimosMorfologico(proc)
	42	+
	43	+
	44	+def analiseSintatica(arvoreSintatica, listaMorfologica):
	45	+ proc = aplicaRegras.aplicarRegrasSint(arvoreSintatica, listaMorfologica)
	46	+ return aplicaSinonimos.sinonimosSintatico(proc)
0	47	\ No newline at end of file
...	...