[发明专利]以语用为核心的自然语言文本辅助知识库书写和检测系统与方法在审
申请号: | 201910429085.8 | 申请日: | 2019-05-22 |
公开(公告)号: | CN112069791A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 谷松;赵丽新;张新华;李国霞 | 申请(专利权)人: | 谷松;赵丽新;张新华;李国霞 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/289;G06F40/30 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710048 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核心 自然语言 文本 辅助 知识库 书写 检测 系统 方法 | ||
以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,包括语用体裁库、语用要素表达子系统、语用体裁真值库、语用关系子系统以及知识推理子系统,本发明还提供了以汉语为输入语言的书写和检测方法,在自然语言书写过程中,以高层次的语用要素类型和语用要素关系决定低层次词性标注、句法语义表示和分析,可识别自然语言的语用,计算语用真值,对知识构成及其自身层次上是否正确进行判断,可以解决知识表达形式的正确性问题,而不仅仅是词法、句法方面的形式判断,并且本发明是根据书写顺序实时判断,书写者严格按系统的流程和规范进行书写的知识可以直接构成系统的知识库,对以后的使用带来很大的方便。
技术领域
本发明属于计算语言学领域,特别涉及一种以语用为核心的自然语言文本辅助知识库书写和检测系统与方法。
背景技术
自然语言的语用真值,指的是语句与语句之间的确定关系的真值,主要通过关系表达式进行计算。特定体裁的语用真值是指对其语用要素及其特定计算关系而设定的真值
传统自然语言识别中,一种趋势是对词法、句法、语义等进行标注,例如哈工大的语言云系统;另外一种趋势是基于统计方法比对语义相似度,例如中国知网的学术不端文献检测(ALMC)系统。两种趋势的共同点在于均不涉及实际意义上的语用真值计算。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种以语用为核心的自然语言文本辅助知识库书写和检测系统与方法,在识别自然语言词法、句法、语义的基础上,增加了句子之间的语用真值及特定题材的语用真值计算。
为了实现上述目的,本发明采用的技术方案是:
一种以语用为核心的自然语言文本辅助知识库书写和检测系统,以汉语为输入语言,包括:
语用体裁库,存储若干种语用体裁,语用体裁是有固定语用要素的由句子构成的有特殊使用目的体裁,这种特殊使用目的可以用确定的语用表达式计算语用体裁真值;常见的语用体裁如论文摘要、借条、合同、通知、报导、诉状以及专利申请书等,其书写范围包括词库、语法、动词以及语用格。语用要素是指各语用体裁中的必要构成部分,例如,体裁为论文摘要时,语用要素为目的、方法、结果、结论或者对象、方法、结果;体裁为借条时,语用要素为债权人、借款金额、利息计算、还款时间、债务人、借款日期;体裁为劳动合同时,语用要素为劳动者、用人单位、合同期限、工作内容、劳动报酬、劳动纪律。
语用要素表达子系统,分别匹配不同语用体裁,包括语用要素标记数据库和语用要素关系计算数据库,语用要素标记数据库存储不同语用体裁中的语用要素标记以及各标记所标注的语用要素类型(比如摘要中的对象类、方法类、结果类),语用要素标记指与语用要素对应的常用关键词,例如关于摘要的语用要素标记包括“对于、采用、得到”等,标记“对于”标注的语用要素是“对象”(对象是指研究的所指),标记“采用”标注的语用要素是“方法”(方法包括研究所采用的具体方法、原理、理论、条件、手段等),标记“得到”标注的语用要素是“结果”(是指实验的、研究的数据,被确定的关系,得到的效果和性能等)。语用要素关系计算数据库存储不同语用体裁中语用要素关系对应的表达式,所述语用关系标记指与语用关系对应的常用关键词,语用要素关系是指每种语用体裁的各个语用要素之间存在的以形式逻辑、公式计算为基础的特定的计算关系。本发明的语用要素与以往“要素”的含义不完全相同。语用要素是指针对语用真值计算而设置的要素,各语用要素之间的关系存在确定的表达式。如摘要这种语用体裁中,可以根据需要设置“目的”、“方法”、“结果”、“结论”四个要素,也可以设置成“目的”、“方法”、“结果”三个要素,还可以设置为“对象”、“方法”、“结果”三个要素,也就是说,同一种体裁下可以对应不同的语用要素方案,书写者可以根据自己的需要选择语用要素方案。以三要素的语用体裁为例,可以设三要素为三元组w=(i,j,k),当j为一个二元关系式,i和k分别为对象集合和结果集合,符合j的定义域,真值为j的值域,k∈j的值域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷松;赵丽新;张新华;李国霞,未经谷松;赵丽新;张新华;李国霞许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910429085.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种压电式柔性三维力传感器
- 下一篇:一种铈酸盐复合材料及其制备方法和应用