泰语字库,泰文字库,泰文组合算法,泰语组合算法
字库交流QQ:2229691219
1.字母编码
这里只介绍泰文的Unicode编码。Unicode编码为双字节,前面为高字节,后面为低字节,这里都用十六进制表示。如0E00表示一个空格,0E为高字节,00为低字节。
泰文编码和字母的对照关系如下:
编码段: 0E00-0E16,0E17-0E2D,0E2E-0E30
泰文字符:กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮฯะ
编码段: 0E31-0E3A
泰文字符:
编码段: 0E3F-0E46
泰文字符:฿ เ แ โ ใ ไ ๅ ๆ
编码段: 0E47-0E4E
泰文字符: ็ ่ ้ ๊ ๋ ์ํ ๎
编码段: 0E4F-0E5B
泰文字符:๏๐๑๒๓๔๕๖๗๘๙๚๛
2.拼写规则
泰语是一种拼音文字。有元音,辅音和声调。
a)元音
元音有单元音和复元音之分,复元音是由两个或三个单元音组成的。单元音可以位于辅音的上下左右各侧。(说明:下面的杠“-”表示辅音的位置。)
规则①:在辅音右边的单元音
字符: -า -ะ -อ
例子: กา จะ ดอ
规则②:在辅音左边的单元音
字符: เ- แ- โ- เ-าะ เ-ะ แ-ะ โ-ะ เ-อ แ-อ
例子:เก แจ โอ แตะ โดะ
规则③:在辅音上边的单元音
字符: -ิ -ี -ึ -ื
例子: ดีษืฉึ
规则④:在辅音下边的单元音
字符: -ุ -ู
例子: กุมู
规则⑤:复元音
字符: เ-ีย เ-ือ -ัว -าย -ัย ไ- ใ- -ุย โ-ย -อย เ-ย -าว เ-า -ิว เ-ว แ-วเ-ียว เ-ือย -วย
例子: เปีย ได๊ แจ๋ว เดือย
b)辅音
单辅音有中辅音,高辅音,低辅音,塞音,擦音等之分。它们与长元音和短元音相拼时,能够影响或决定声调。复辅音是由多个单辅音组成的。
单辅音:กจดตฎฏบปอขคฆฉชฌผพภฝฟถฐทธฑฒสศษซหฮงนมยญวรลฬ
规则①:有辅音字母อ 字母和元音字母อ 外形相同,只能靠其位置进行区分。
例子: ออ
规则②:有辅音字符ปฝฟ,上面加元音或声调时,元音或声调字符要略微向左移一些。
例子:ปิป๊ฟีฝื่
c)声调
泰文中有5个声调,只有第一声不用标出来。
声调:
规则①:声调加在辅音的右上方。
例子:ก่า
规则②:辅音上有元音,再加声调符号时,声调符号要加在元音上。
例子:อื่ทึ๊
d)尾音
尾音: -ง -น -ม -ำ -ก -ด -บ
规则①:元音字母-ะ 后有尾音时。要把-ะ写成-ั,放在辅音和尾音之间的上方。
例子: 如กะง 要写成กัง
规则②:元音字母เ-ะ 和แ-ะ 后有尾音时,把-ะ 写成-็,放在辅音和尾音之间的上方。
例子: 如เตะม 写成เต็ม
规则③:元音字母โ-ะ 后有尾音时,โ-ะ省略不写成。
例子: 如โตะม 写成ตม
规则④:复元音-ัว 后有尾音时,要将去-ั掉。
例子: 如จัวน 写成จวน
规则⑤: -ำ 和-ัม 读音相同,词义不同。
例子: 如จกำ和กัม
e)数字
泰文有自己的数字符(0-9)。
数字字符:๐๑๒๓๔๕๖๗๘๙
f)其他
其他符号ฤฦๅ ์(不发音符号)ๆ(重复符号)ฯ(简略符号)
3.处理方式
根据上述的拼写规则,可以把所有字符形象的分为如下几类:
1.鞋子字符。它可以叠加在主体字符的下面,就像给主体字符穿的鞋子一样。
2.主体字符。它上面可以叠加帽子字符,下面可以叠加鞋子字符,就像给它带上帽子,穿上鞋子一样。
3.帽子字符。它可以叠加在主体字符的下面,就像给主体字符带上帽子一样。
4.声调字符。它是一个词语的声调,必须叠放在主体字符或帽子字符上面。
5.独立字符。它是不可以穿鞋子,不可以带帽子,也不可以加声调的一类字符。
6.标点符号。它是用来断句的标点符号,和其他语言中的标点符号的功能一样。
a)鞋子
编码段:0E38-0E39
字符: ุ ู
b)主体
编码段:0E01-0E10,0E11-0E1F,0E20-0E2E,0E32
字符:กขฃคฅฆงจฉชซฌญฎฏฐฑฒณดตถทธนบปผฝพฟภมยรฤลฦวศษสหฬอฮ า
c)帽子
编码段:0E31, 0E47,0E33-0E37,0E4C-0E4E
字符: ั ็ ำ ิ ี ึ ื์ ํ ๎
d)声调
编码段:0E48-0E4B
字符:
e)独立
编码段:0E2F,0E30,0E3A,0E40-0E46,0E5A-0E5B
字符: ฯะ ฺ เ แ โ ใ ไ ๅ ๆ๚๛
f)标点
编码段:0E00,0E3F,0E4F-0E59
字符: ฿ ๏๐๑๒๓๔๕๖๗๘๙
g)其他
编码段:0E3B-0E3E,0E5B-0E7F
补充说明:
1.如果用①②③④⑤⑥分别表示鞋子字符,主体字符,帽子字符,声调字符,独立字符和标点符号。
则可能出现的组合情况有:①②,①②③,①②④,①②③④,②③,②④,②③④,⑤和⑥。
2.①和③之间没有②的时候,③需要往下移动一点。
3.②的编码是0E1B,0E1D,0E1F时,③或④或③④,最好向左移动一点。
4.②的编码是0E0D或0E10,而①的编码是0E38 或0E39时,②的下部不画,用①来代替。
非常感谢 高金山先生的无私奉献!
![](/assets/blank.gif)
泰语字库,泰文字库,泰文组合算法,泰语组合算法相关推荐
- centos 8 的图形操作界面在哪_文泰刻绘2020下载-文泰刻绘2020官方版下载[图形化编程平台]...
文泰刻绘2020官方版是一款高效实用的电脑刻绘软件.文泰刻绘2020最新版采用最新V10版专用刻绘程序,可以直接刻绘输出,支持USB刻字机,软件支持最新win10操作系统.文泰刻绘2020官方版还提供 ...
- word文档中把几个图形组合在一起
word文档中把几个图形组合在一起 在文档中绘制图形时,想把多个图形组合在一起成为一个整体.这需要用到组合命令.下面,我们来看下操作步骤. 下面中的文档,已绘制出三个图形: 现在需要把这三个图形给组合 ...
- 【案例】泰康集团——泰生活APP A/B测试平台场景应用
"本项目案例由 火山引擎 投递并参与由数据猿&上海大数据联盟联合推出的"行业盘点季之数智化转型升级"大型主题策划活动之<2021中国企业数智化转型升级创新服 ...
- 【Android 逆向】ELF 文件格式 ( ELF 文件头 | ELF 文件头标志 | ELF 文件位数 | ELF 文件大小端格式 )
文章目录 一.ELF 文件简介 二.ELF 文件头 三.ELF 文件头标志 四.ELF 文件位数 五.ELF 文件大小端格式 一.ELF 文件简介 在上一篇博客 [Android 逆向]ELF 文件格 ...
- 【算法】双指针算法 ( 有效回文串 II )
算法 系列博客 [算法]刷题范围建议 和 代码规范 [算法]复杂度理论 ( 时间复杂度 ) [字符串]最长回文子串 ( 蛮力算法 ) [字符串]最长回文子串 ( 中心线枚举算法 ) [字符串]最长回文 ...
- 回文树(回文自动机) - URAL 1960 Palindromes and Super Abilities
Palindromes and Super Abilities Problem's Link: http://acm.timus.ru/problem.aspx?space=1&num=1 ...
- 【示例】solr添加文档/删除文档/简单查询/多条件查询
solr添加文档/删除文档/简单查询/多条件查询
- 一文了解贪心算法和回溯算法在前端中的应用
一文了解贪心算法和回溯算法在前端中的应用 一.贪心算法 1.贪心算法是什么? 2.应用场景 3.场景剖析:零钱兑换 二.回溯算法 1.回溯算法是什么? 2.什么问题适合选用回溯算法解决? 2.应用场景 ...
- access中判断回文的代码_前端也来点算法(TypeScript版) | 2 - 回文数和回文链表
算法采用 TS 进行编写. 回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数.回文链表是链表节点的值和回文数有相同规律的链表. " 回文数 这个数字可以看成是以中心对称分布的 ...
- java无法读取方案文档_解决Spring的java项目打包后执行出现“无法读取方案文档...“、“原因为 1) 无法找到文档; 2) 无法读取文档; 3) 文档的根元素不是...”问题...
问题 一个用Spring建的java项目,在Eclipse或idea中运行正常,为什么打包后运行出现如下错误呢? 2019/07/10/19:04:07 WARN [main] org.springf ...
最新文章
- .net之工作流工程展示及代码分享(二)工作流引擎
- 第 5 章 Nova - 030 - Launch和Shut Off操作详解
- 毕业设计 基于python的网络爬虫-基于python的网络爬虫
- 使用date命令,进行时间戳和日期时间的互转
- 会签 数据库表设计_关于数据库表设计和实体类设计的思考
- Windows 查看端口占用
- 间歇性掉帧卡顿_电脑卡顿问题靠它解决,我只能帮你到这儿了
- 计算机用户win7修改不,Win7电脑时间改不了的解决方法
- idea使用activiti插件
- DeepMind推出更难的机器阅读理解数据集,要让AI读懂整本书
- 20170907wdVBA_ImportPicturesBaseOnExcel
- 同源性 相似性 一致性
- angular ng-show中表达式的写法
- shader篇-单张纹理
- DSDT与SSDT提取
- 透明壁纸android,主题透明壁纸软件下载-主题透明壁纸 安卓版v1.0-PC6安卓网
- 如何从零开始学习软件测试
- python tcl tk_安装Python WARNING: The version of Tcl/Tk (8.5.9)
- Ubuntu 分辨率设置 1920*1080
- Linux下Java剪贴板的访问
热门文章
- linux设备驱动子系统,Linux设备驱动子系统终极弹 - USB
- 遭遇勒索病毒数据库被删除之后
- 代码中能找到,但启动报错:required a bean of type ‘com.XXX‘ that could not be found.
- CentOs7.5 连接不上Xfp,XShell,防火墙未关闭
- 做自媒体视频剪辑,专业的人会怎么寻找背景音乐素材?
- WEKA (概率的应用)
- 计算机专业考研复试专业英语翻译必备词汇
- Windows Azure Pack与VMware VRA 对比(六)Azure Pack MSSQL PaaS功能测试
- 安卓开发学习------6.练习SharedPreferences用法和文件IO
- C++ Primer 与“类”有关的注意事项总结