[发明专利]一种自然语言处理系统在审

专利信息
申请号: 201811069719.5 申请日: 2018-09-13
公开(公告)号: CN109213846A 公开(公告)日: 2019-01-15
发明(设计)人: 张巍;胡慧香;郭继红;张晓瑛;徐雅琴;边婧 申请(专利权)人: 山西卫生健康职业学院
主分类号: G06F16/33 分类号: G06F16/33
代理公司: 西安研创天下知识产权代理事务所(普通合伙) 61239 代理人: 孙李林
地址: 030012 *** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自然语言处理系统 逻辑推理 分词处理模块 自然语言信息 后处理模块 语法数据库 预处理模块 知识数据库 扩展性 参数标注 匹配模块 输出模块 输入模块 文法规则 语法结构 语境处理 语言信息 规则集 模型库 句子 抽象
【说明书】:

发明公开了一种自然语言处理系统,包括输入模块、语境处理模块、预处理模块、分词处理模块、后处理模块、参数标注模块、语法数据库、文法规则匹配模块、知识数据库、逻辑推理模型库和输出模块。本发明的自然语言处理系统通过联系上下文、扩充参数词典和规则集来提高对自然语言信息的理解能力,使系统有较好的领域扩展性。对于识别效果不好的语言信息只需按照其语法结构抽象出新的规则并添加到系统中,就能够改善对这类句子的识别效果,实现起来简单而有效。

技术领域

本发明属于计算机技术领域,具体地说,涉及一种自然语言处理系统。

背景技术

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

自然语言的形式(字符串)与其意义之间是一种多对多的关系。其实这也正是自然语言的魅力所在。但从计算机处理的角度看,我们必须消除歧义,而且有人认为它正是自然语言理解中的中心问题,即要把带有潜在歧义的自然语言输入转换成某种无歧义的计算机内部表示。

歧义现象的广泛存在使得消除它们需要大量的知识和推理,这就给基于语言学的方法、基于知识的方法带来了巨大的困难,因而以这些方法为主流的自然语言处理研究几十年来一方面在理论和方法方面取得了很多成就,但在能处理大规模真实文本的系统研制方面,成绩并不显著。研制的一些系统大多数是小规模的、研究性的演示系统。

目前存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内。

发明内容

本发明的目的在于提供一种提高处理质量的自然语言处理系统。

其技术方案如下:

一种自然语言处理系统,包括输入模块、语境处理模块、预处理模块、分词处理模块、后处理模块、参数标注模块、语法数据库、文法规则匹配模块、知识数据库、逻辑推理模型库和输出模块;

所述输入模块用于通过输入设备输入自然语言;

所述语境处理模块用于通过联系上下文,分析自然语言所处的语境;

所述预处理模块用于对自然语言的源文本进行标记、拆分以及干扰符号的删除,提高分词速度和准确率;

所述分词处理模块用于将自然语言的句子划分为词序列;

所述后处理模块用于对分词处理模块的分词结果进行优化;

所述参数标注模块用于对后处理模块的分词结果进行参数标注;

所述文法规则匹配模块根据语法数据库、知识数据库、逻辑推理模型库和参数标注模块标注后的分词结果进行匹配;

所述输出模块用于通过输出设备输出自然语言的处理结果的文字、图形和语音。

进一步,所述输入设备包括键盘、语音设备、图文扫描设备。

进一步,所述干扰符号包括无用的空格、回车和与输入介质相关的符号。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西卫生健康职业学院,未经山西卫生健康职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811069719.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top