symbols.dic
5.6 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
#locale/ta/symbols.dic
#A part of NonVisual Desktop Access (NVDA)
#Copyright (c) 2011-2013 NVDA Contributors
# Thanks: Association for the Rights of the Visually Challenged (ARVIC), Coimbatore, Tamil Nadu, India
#This file is covered by the GNU General Public License.
complexSymbols:
# identifier regexp
# Sentence endings.
. sentence ending (?<=[^\s.])\.(?=[\"'”’)\s]|$)
! sentence ending (?<=[^\s!])\!(?=[\"'”’)\s]|$)
? sentence ending (?<=[^\s?])\?(?=[\"'”’)\s]|$)
# Phrase endings.
; phrase ending (?<=[^\s;]);(?=\s|$)
: phrase ending (?<=[^\s:]):(?=\s|$)
# Others
decimal point (?<=\d)\.(?=\d)
in-word ' (?<=[^\W_])['’]
negative number (?<!\w)-(?=[$£€¥]?\d)
# Treat dash differently when it is sandwitched between a number and a tamil character.
# tamil unicode range is U+0B80–U+0BFF according to http://en.wikipedia.org/wiki/Tamil_script
tamilNumberDash (?<=[0-9])\-(?=[-])
symbols:
# identifier replacement[[ level][ preserve]][ # display name]
# Complex symbols
. sentence ending முற்றுப் புள்ளி all always
! sentence ending கூவல்! all always
? sentence ending கேள்வி? all always
; phrase ending அரைப் புள்ளி most always
: phrase ending முக்கால் புள்ளி most always
decimal point புள்ளி none always
in-word ' ஒற்றை மேற்கோள் all norep
negative number கழித்தல் none norep
# number dash, tamil letter special case:
tamilNumberDash இணைக்கோடு char always
# Whitespace
\0 வெற்றிடம் char # null
\t தத்தல்
\n வரியூட்டம் char
\f பக்க முறிவு none
\r ஏந்தி மீளல் char
இடைவெளி char
இடைவெளி char # no-break space
# Standard punctuation/symbols
! கூவல்! all
" மேற்கோள் most
\# எண் most
$ டாலர் all norep
£ pound all norep
€ euro all norep
¢ Cents all norep
¥ Yen all norep
₹ ரூபாய் none norep
% விழுக்காடு none
& மற்றும் some
' ஒற்றை மேற்கோள் all
( இடப்பிறை most
) வலப்பிறை most
* பெருக்கல் some
+ கூட்டல் some
, கால் புள்ளி all always
- இணைக்கோடு most
. புள்ளி some
/ சாய்வு some
: முக்கால் புள்ளி most norep
; அரைப் புள்ளி most
< குறைவு most
> மிகுதி most
= சமம் some
? கேள்வி? all
@ at some
[ இடப்பகரம் most
] வலப்பகரம் most
\\ பின்சாய்வு most
^ caret most
_ அடிக்கோடு most
` graav most
{ இடகணம் most
} வலகணம் most
| செங்குத்து most
~ tilda most
# Other characters
• தோட்டா none
… விடுநிலை all always
... விடுநிலை all always
தோட்டா none
“ இட மேற்கோள் most
” வல மேற்கோள் most
‘ இட ஒற்றை மேற்கோள் most
’ வல ஒற்றை மேற்கோள் most
– சிறுகோடு most
— சிறுகோடு most
● வட்டம் most
¨ diaeresis most
left to right mark char
right to left mark char
■ கருஞ்சதுரம் some
▪ கருஞ்சதுரம் some
◾ கருஞ்சதுரம் some
◦ வெள்ளைத் தோட்டா some
➔ வலதம்பு some
§ பிரிவு all
° பாகை some
« double left pointing angle bracket
» double right pointing angle bracket
µ micro some
¹ மேலெழுத்து 1 some
² மேலெழுத்து 2 some
³ மேலெழுத்து 3 some
® பதிவு none
™ வணிகம் some
© பதிப்புரிமை none
± கூட்டல் கழித்தல் most
× தடவை most
÷ வகுத்தல் most
← இடதம்பு some
→ வலதம்பு some
✓ தேர்வு some
✔ தேர்வு some
#Mathematical Operators U+2200 to U+220F
∀ For All none
∁ Complement none
∂ Partial Derivative none
∃ There exists none
∄ There Does Not Exist none
∅ EMPTY SET none
∆ INCREMENT none
∇ NABLA none
∈ ELEMENT OF none
∉ NOT AN ELEMENT OF none
∊ SMALL ELEMENT OF none
∋ CONTAINS AS MEMBER none
∌ DOES NOT CONTAIN AS MEMBER none
∍ SMALL CONTAINS AS MEMBER none
∎ END OF PROOF none
∏ N-ARY PRODUCT none
# Miscellaneous Mathematical Operators
∑ N-ARY SUMMATION none
√ SQUARE ROOT none
∛ CUBE ROOT none
∜ FOURTH ROOT none
∝ PROPORTIONAL TO none
∞ INFINITY none
∟ RIGHT ANGLE none
∠ ANGLE none
∥ PARALLEL TO none
∦ NOT PARALLEL TO none
∧ LOGICAL AND none
∨ LOGICAL OR none
∩ INTERSECTION none
∪ UNION none
∫ INTEGRAL none
∴ THEREFORE none
∵ BECAUSE none
∶ RATIO none
∷ PROPORTION none
≤ LESS-THAN OR EQUAL TO none
≥ GREATER-THAN OR EQUAL TO none
⊂ SUBSET OF none
⊃ SUPERSET OF none
⊆ SUBSET OF OR EQUAL TO none
⊇ SUPERSET OF OR EQUAL TO none
π பை none
# Special Tamil Characters
௰ பத்து none
௱ நூறு none
௲ ஆயிரம் none
௳ நாள் none
௴ மாதம் none
௵ ஆண்டு none
௶ பற்று none
௷ வரவு none
௸ மேலிருப்பது போல் none
௺ எண்ணுரு none
ௐ ஓம் none
# Other characters
† குத்துவாள் most
‡ இரட்டைக் குத்துவாள் most