[发明专利]藏文文本的向量模型表示方法在审

专利信息
申请号: 201410734163.2 申请日: 2014-12-05
公开(公告)号: CN104408037A 公开(公告)日: 2015-03-11
发明(设计)人: 才智杰;才让卓玛 申请(专利权)人: 才智杰;才让卓玛
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 810008 青海省西宁市五四*** 国省代码: 青海;63
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 藏文 文本 向量 模型 表示 方法
【说明书】:

技术领域

发明涉及藏文信息处理技术领域,特别涉及藏文文本的向量模型表示方法。 

背景技术

藏族是我国古老的民族之一,主要分布在西藏、青海、甘肃、云南、四川等五省区。藏族有着悠久的历史、灿烂的文化。藏文是藏语的文字系统,自公元 7世纪创制以来,经过三次较大规模的厘定,日臻完善,制定了藏文文法,倾注了历代诸多先哲的智慧,为藏文化的丰富和发展起到了积极的作用,架起了藏族与其他兄弟民族文化交流的桥梁,构筑了祖国边陲的文化防线,创造了卷帙浩繁的文献资料。藏文字的使用者分布于我国西藏、青海、四川、甘肃、云南,以及巴基斯坦、印度、尼泊尔、不丹等国家和地区,使用较为广泛,使用者超过 700 万人。 

藏文信息处理是藏语言学与计算机技术的交叉学科,是藏语言研究的重要组成部分,在信息化时代的今天,藏文信息处理对我国政治、经济、文化发展有着重要意义。因此,在党的民族政策和民族语言政策的感召下,藏文信息处理技术得到了飞速的发展,藏文字编码、字库、输入法、分词和语料库建设等方面取得了可喜的研究成果,为深层次开展藏文信息处理奠定了坚实的基础。相对而言,藏文信息处理起步较晚,前些年藏文信息处理的工作主要集中在字编码、字库的研究上,随着国家、国际标准的确定尘埃落定。近年来藏文信息处理的研究工作逐步进入藏语词法分析、句法分析、语义分析以及语用分析等藏文文本分析阶段,用机器分析和理解藏文文本需考虑文本的表示方法。藏文文本的合理表示有利于藏文文本的各项运算和操作,特别是近几年随着大数据时代的到来,藏文文本的表示技术尤为重要,但是藏文文本的表示技术研究目前基本处于空白和起步阶段。 

藏文文本由藏文字、藏文数字符号和藏文标点符号组成。藏文字由30个辅音字母和4个元音字母构成的拼音文字,结构上由基字(基本辅音)、前加字、上加字、下加字、后加字、重后加字及元音组成,其中前加字、基字、后加字与重后加字横向拼写,而在基字所在的竖直方向上还可能有上加字、基字、下加字和元音的纵向拼写。藏文数字符号表示时间、顺序、年代、长幼等,使用最广泛的有“ ”等。藏文标点符号在文本中用来分隔字、或者表示停顿、语气以及词语的性质和作用,主要有音节符“”、单垂符“”、双垂符“”和四垂符“”等,音节符用来分隔文本中的音节,使用时放在两个音节之间,单垂符、双垂符和四垂符放在短语或句子的末尾,表示一个短语的结束或一个句子的结束或一个章节的结束。由上可见藏文字是藏文文本的主要组成部分。 

本发明建立了藏文文本的向量模型表示方法,包括藏文字的向量模型表示方法和藏文字符串的向量模型表示方法。用向量模型表示藏文文本,把藏文文本转换成易于处理的向量模型,简化了藏文文本的各种运算和操作,使藏文信息处理更加高效。 

发明内容

技术问题:为了便于藏文文本的各项运算和操作,使藏语词法分析、句法分析、语义分析及语用分析等用机器分析和理解藏文文本提供一种简捷高效的表示方法,本发明建立了藏文文本的向量模型表示方法。本发明需要解决的问题之一是建立一种藏文字的向量模型表示方法;本发明需要解决的问题之二是建立一种藏文字符串的向量模型表示方法。 

藏文字的向量模型表示方法,藏文字用向量集T={<t1,t2,t3,t4,t5,t6,t7>|0≤t1≤5,0≤t2≤3,0<t3≤30,0≤t4≤4,0≤t5≤4,0≤t6≤10,0≤t7≤2}中的元素表示;藏文字符串的向量模型表示方法,藏文字符串由若干个藏文字组成,根据藏文字的向量模型表示方法,每个藏文字对应一个含7个分量的一维向量,把藏文字符串中每个藏文字依次用其一维向量的转置表示得藏文字符串的二维向量模型Γ=(tij)。用向量模型表示藏文文本,把藏文文本转换成易于处理的向量模型,简化了藏文文本的各种运算和操作,使藏文信息处理更加高效。 

技术方案:本发明的藏文文本的向量模型表示方法包括: 

1.藏文字的向量模型表示方法

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于才智杰;才让卓玛,未经才智杰;才让卓玛许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410734163.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top