[发明专利]基于藏文字符构件识别技术的藏文字符字典排序的方法在审
申请号: | 201610662188.5 | 申请日: | 2016-08-12 |
公开(公告)号: | CN106250357A | 公开(公告)日: | 2016-12-21 |
发明(设计)人: | 高定国;格桑多吉;普次仁;高红梅;李苗苗;巴桑卓玛 | 申请(专利权)人: | 高定国 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/28 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司11385 | 代理人: | 董芙蓉 |
地址: | 850000 *** | 国省代码: | 西藏;54 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于藏文字符构件识别技术的藏文字符字典排序的方法,涉及藏文信息处理技术领域,本发明由藏文字符构件识别和藏文字符排序两个步骤及两部分组成。藏文字符构件识别是藏文字符排序的先决条件,只有正确识别了藏文字符的构件后,才能进行藏文字符的排序。本发明有益效果:1、藏文字符结构的正确识别。由于所有的现代藏字都包含在48种结构中,按照本发明提出的方法识别藏文字符的结构,识别结果可以达到100%的准确率。2、藏文字符的字典序的排序方法。在识别藏文字符构件的基础上,按照本发明提出的排序方法能够对藏文字符进行排序,排序的结果符合藏文字典序列。可以广泛用于计算机藏文数据的排序、藏文字典的编排等。 | ||
搜索关键词: | 基于 藏文 字符 构件 识别 技术 字典 排序 方法 | ||
【主权项】:
一种基于藏文字符构件识别技术的藏文字符字典排序的方法,其特征在于,包括以下步骤:S1.按照藏文文法对现代藏字的构字结构进行分析,得出藏文有48种基本结构;S2.优先处理特殊结构,首先判断该字符中是否含有特殊构件音节,如果有特殊构件,再按照该结构中的字符个数和有无元音判断该特殊构件的结构;S3.把藏文纵向固定叠加的组合块作为一个整体处理,按照藏文的结构,把“上加字+基字”、“基字+下加字”、“上加字+基字+下加字”作为固定的结构识别藏文字符构件,把要判断的当前音节在这些结构中查找,如果在该结构中找到就能很好、很快地判断该音节的结构,则建立3个表,用于处理固定结构和识别特殊字符;S4.对不带元音、没有叠加的三个构件的藏字有一些具有二义性,再建立1个表对二义性的14个字符进行特殊处理;S5.从藏文字符有无元音和元音的位置来判断构件,进行构件拆分,将识别的藏文字符的构件按照“前加字‑上加字‑基字‑下加字‑再下加字‑元音‑后加字‑再后加字”八个部分放置;S6.确定藏文字符字典序的排序模型,最核心的层次即第一层是基字层,而从第二层到第七层分别是上加字、前加字、下加字、元音、后加字和再后加字;S7.定义一个TibetWord结构体,把读取的音节和识别的构件存入一个结构体中,存储空间主要用来存放音节及构件,选择一种排序方法进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高定国,未经高定国许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610662188.5/,转载请声明来源钻瓜专利网。