[发明专利]藏文字成分分析方法、藏文排序方法以及对应装置有效

专利信息
申请号: 201610528753.9 申请日: 2016-07-05
公开(公告)号: CN106156006B 公开(公告)日: 2019-07-23
发明(设计)人: 尼玛扎西;完么扎西 申请(专利权)人: 尼玛扎西
主分类号: G06F17/27 分类号: G06F17/27;G06F17/22
代理公司: 北京瀚群律师事务所 11581 代理人: 安筱琼
地址: 850000 西藏*** 国省代码: 西藏;54
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种藏文字成分分析方法、藏文排序方法以及对应装置,涉及自然语言处理领域。为解决现有的藏文排序方法不具有通用性或兼容性,不便于计算机藏文自动排序的使用的问题而发明。本发明提供的技术方案包括:S10、获取待分析的藏文文本;S20、将所述藏文文本中藏文字作为预设有限状态自动机群组的输入;S30、当所述有限状态自动机群组中目标有限状态自动机确定所述藏文文本中藏文字拼写正确时,根据所述目标有限状态自动机获取该藏文字的组成成分。
搜索关键词: 藏文 成分 分析 方法 排序 以及 对应 装置
【主权项】:
1.一种藏文排序方法,其特征在于,包括:S10、获取待排序的至少两个藏文字;S20、分别将所述待排序的至少两个藏文字作为预设有限状态自动机群组的输入;S30、当所述有限状态自动机群组中目标有限状态自动机确定输入的藏文字拼写正确时,根据所述目标有限状态自动机获取该藏文字的组成成分;S40、根据所述至少两个藏文字的组成成分,对所述至少两个藏文字进行排序,得到排序结果;所述有限状态自动机群组包括24个有限状态自动机,其中任一有限状态自动机Mi=(Σi,Qi,δi,qi,Fi);所述Σi为预设藏文拼写形式文法Gi的终结符的有限集合;所述Qi为所述藏文拼写形式文法Gi的非终结符的有限集合Vi与所述Fi的并集;所述δi是根据Qi与Σi之直积Qi×Σi到Qi的映射获取的所述有限状态自动机Mi的状态转移函数;所述qi为所述有限状态自动机Mi的初始状态,所述qi∈Qi;所述Fi为所述有限状态自动机Mi的终止状态的有限集合,所述所述i为正整数,所述i≤24;对于所述至少两个藏文字中任意两个藏文字,所述S40包括:S401、根据该两个藏文字的组成成分判断该两个藏文字是否符合预设成分规则;如果符合,执行S402;否则,执行S404;S402、判断该两个藏文字的基字是否相同;如果相同,执行S403;否则,执行S404;S403、根据该两个藏文字的组成成分依次按前加字、上加字、下加字、元音、后加字、再后加字的顺序进行比较;执行S405;S404、根据该两个藏文字的组成成分依次按上加字、前加字、下加字、元音、后加字、再后加字的顺序进行比较;执行S405;S405、如果比较结果为该两个藏文字中前一个藏文字大于后一个藏文字,则该两个藏文字的顺序对调;否则,该两个藏文字的顺序不变。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尼玛扎西,未经尼玛扎西许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610528753.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top