[发明专利]基于语素的汉语智能处理方法和系统及装置有效

专利信息
申请号: 201710857227.1 申请日: 2017-09-21
公开(公告)号: CN109086285B 公开(公告)日: 2021-10-15
发明(设计)人: 夏铨真 申请(专利权)人: 佛山辞荟源信息科技有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/58
代理公司: 北京润川律师事务所 11643 代理人: 陈振;张超
地址: 528300 广东省佛山市顺德区大*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语素 汉语 智能 处理 方法 系统 装置
【权利要求书】:

1.一种基于语素的汉语智能处理方法,其特征在于,包括以下步骤:以语素作为构词单位,收集诗词数据;

建立诗词数据库的字段,并生成关系型诗词数据库字段;

将所述收集到的诗词数据,添加到所述关系型诗词数据库各字段中,并建立所述诗词数据内部之间,以及诗词数据之间的数据链接树生成具有诗词数据的关系型语素数据库;

还包括如下步骤:以语素为词及短语的构词单位,使用所述诗词数据库进行检索诗词数据;

还包括如下步骤:根据所述诗词数据链接树得到原文全文、翻译、读音、作者、历史中的一种或者多种的组合;

还包括如下步骤:如未检索到所需要的诗词,则直接返回;或者返回将检索到的其他诗词,作为新的诗词数据,添加到关系型诗词数据库中,并进行关系型数据链接,然后返回退出;

所述添加数据并对数据进行关系链接,包括如下步骤:将收集到的诗词数据,添加到所述关系型诗词数据库的各字段中;

建立以语素为根,建立单字语素和词语语素为枝,诗词数据为叶的数据链接树;

在数据链接树的各个诗词数据之间,建立相应的链接。

2.根据权利要求1所述的汉语智能处理方法,其特征在于,所述语素是最小语言单位,比字更小,同一个字对应多个语素;

语素和字之间的最明显区别是语素表意,中性,用多种不同字形显示,所以其代码称之为“中性码”。

3.根据权利要求2所述的汉语智能处理方法,其特征在于,所述语素从组词角度分为①语文类语素②姓氏类语素③人名类语素④地名类语素⑤科技类语素⑥古汉语语素⑦无义表音语素⑧表形语素。

4.根据权利要求2所述的汉语智能处理方法,其特征在于,所述诗词数据为古诗词数据;

所述古诗词数据为《唐诗》、《宋词》、《诗经》、《史记》、《说文解字》、《三字经》、《康熙字典》中一种或者一种以上的组合。

5.根据权利要求2所述的汉语智能处理方法,其特征在于,所述诗词数据库包括诗词原文字段和诗词翻译字段。

6.根据权利要求5所述的汉语智能处理方法,其特征在于,所述诗词数据库还包括原文中文读法字段、外语读法字段、行字段、外语行字段;作者字段、作者翻译字段中的一种或者一种以上的组合。

7.根据权利要求6所述的汉语智能处理方法,其特征在于,所述诗词数据库通过检索语素进行检索;

所述检索语素分为单字语素和词语语素;

所述词语语素,是指至少具有两个字,包括一个或者多个单字语素,同时所述单字语素组合在一起构成有意义的固定意义单位。

8.一种基于语素的汉语智能处理系统,其特征在于,包括权利要求1至7任一项所述的基于语素的汉语智能处理方法的计算机系统软件模块。

9.根据权利要求8所述的汉语智能处理系统,其特征在于,包括收集模块,字段建立模块,关系链接模块,其中:所述收集模块,用于以语素作为构词单位,收集诗词数据;

所述字段建立模块,用于建立诗词数据库的字段,并生成关系型诗词数据库各字段;

所述关系链接模块,用于将所述收集到的诗词数据,添加到所述关系型诗词数据库各字段中,并建立所述诗词数据内部之间,以及诗词数据之间的数据链接树。

10.根据权利要求9所述的汉语智能处理系统,其特征在于,还包括检索模块,用于以语素为词及短语的构词单位,使用所述诗词数据库进行检索诗词数据,根据诗词数据链接树得到原文全文、翻译、读音、作者、历史中的一种或者一种以上的组合。

11.根据权利要求9或10所述的汉语智能处理系统,其特征在于,还包括数据添加模块,用于如未检索到所需要的诗词,则直接返回;或者将检索到的其他诗词,作为新的诗词数据,添加到关系型诗词数据库中,并进行关系型数据链接,然后返回退出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山辞荟源信息科技有限公司,未经佛山辞荟源信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710857227.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top