[发明专利]藏文字成分分析方法、藏文排序方法以及对应装置有效
申请号: | 201610528753.9 | 申请日: | 2016-07-05 |
公开(公告)号: | CN106156006B | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 尼玛扎西;完么扎西 | 申请(专利权)人: | 尼玛扎西 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/22 |
代理公司: | 北京瀚群律师事务所 11581 | 代理人: | 安筱琼 |
地址: | 850000 西藏*** | 国省代码: | 西藏;54 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种藏文字成分分析方法、藏文排序方法以及对应装置,涉及自然语言处理领域。为解决现有的藏文排序方法不具有通用性或兼容性,不便于计算机藏文自动排序的使用的问题而发明。本发明提供的技术方案包括:S10、获取待分析的藏文文本;S20、将所述藏文文本中藏文字作为预设有限状态自动机群组的输入;S30、当所述有限状态自动机群组中目标有限状态自动机确定所述藏文文本中藏文字拼写正确时,根据所述目标有限状态自动机获取该藏文字的组成成分。 | ||
搜索关键词: | 藏文 成分 分析 方法 排序 以及 对应 装置 | ||
【主权项】:
1.一种藏文排序方法,其特征在于,包括:S10、获取待排序的至少两个藏文字;S20、分别将所述待排序的至少两个藏文字作为预设有限状态自动机群组的输入;S30、当所述有限状态自动机群组中目标有限状态自动机确定输入的藏文字拼写正确时,根据所述目标有限状态自动机获取该藏文字的组成成分;S40、根据所述至少两个藏文字的组成成分,对所述至少两个藏文字进行排序,得到排序结果;所述有限状态自动机群组包括24个有限状态自动机,其中任一有限状态自动机Mi=(Σi,Qi,δi,qi,Fi);所述Σi为预设藏文拼写形式文法Gi的终结符的有限集合;所述Qi为所述藏文拼写形式文法Gi的非终结符的有限集合Vi与所述Fi的并集;所述δi是根据Qi与Σi之直积Qi×Σi到Qi的映射获取的所述有限状态自动机Mi的状态转移函数;所述qi为所述有限状态自动机Mi的初始状态,所述qi∈Qi;所述Fi为所述有限状态自动机Mi的终止状态的有限集合,所述所述i为正整数,所述i≤24;对于所述至少两个藏文字中任意两个藏文字,所述S40包括:S401、根据该两个藏文字的组成成分判断该两个藏文字是否符合预设成分规则;如果符合,执行S402;否则,执行S404;S402、判断该两个藏文字的基字是否相同;如果相同,执行S403;否则,执行S404;S403、根据该两个藏文字的组成成分依次按前加字、上加字、下加字、元音、后加字、再后加字的顺序进行比较;执行S405;S404、根据该两个藏文字的组成成分依次按上加字、前加字、下加字、元音、后加字、再后加字的顺序进行比较;执行S405;S405、如果比较结果为该两个藏文字中前一个藏文字大于后一个藏文字,则该两个藏文字的顺序对调;否则,该两个藏文字的顺序不变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尼玛扎西,未经尼玛扎西许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610528753.9/,转载请声明来源钻瓜专利网。