[发明专利]一种基于语义组件的学术知识问答方法、系统、设备及存储介质在审
申请号: | 202211018126.2 | 申请日: | 2022-08-24 |
公开(公告)号: | CN115344714A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 任一支;李岗;王冬;袁理锋;吴国华;王秋华 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/242;G06F40/295;G06F40/30;G06F40/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 组件 学术 知识 问答 方法 系统 设备 存储 介质 | ||
本发明公开了一种基于语义组件的学术知识问答方法,包括如下步骤:S1、构建学术领域知识库;S2、基于意图语义组件构建学术查询的知识图谱子图;S3、基于约束语义组件修正知识图谱子图;S4、答案生成。该方法以互联网公开的学术领域信息为初始数据源,建立领域内的知识图谱、同义词映射库和属性知识图谱;结合语义组件,过滤出学术查询问句对应的知识图谱子图,实现对学术查询中意图的正确判定,可用于基本学术信息查询场景。
技术领域
本发明涉及计算机数据处理技术领域,具体指一种基于语义组件的学术知识问答方法、系统、设备及存储介质。
背景技术
在人工智能和大数据时代,利用大数据、知识图谱等新一代技术构建一个自动化程度高、人机交互式的智能问答系统,将数据库中庞大、结构复杂的数据进行分析,转化为准确、简洁的答案回答自然语言问题,可以满足人们快速、准确地获取信息的需求。学术领域知识问答系统旨在基于知识图谱对学术领域的数据进行存储和处理,从而回答学术研究者的问题,帮助其获取自己所需要的信息。
目前,学术信息检索方式多以关键词匹配的方式为主,从传统的数据库中查找,到现有的问答检索系统,尽管实现了对数据的筛选和自然语言方式的识别查询,但因为对查询意图不能实现真正理解,查询结果常常与所查找的主题相关性低,无法满足学术研究中快速、准确地获取信息的需求。因此,如何实现对学术查询中意图的正确判定,是当前学术领域问答系统工作中亟需解决的问题。
发明内容
为解决上述问题,本发明提供了一种基于语义组件的学术知识问答方法及系统。该方法以互联网公开的学术领域信息为初始数据源,建立领域内的知识图谱、同义词映射库和属性知识图谱;结合语义组件,过滤出学术查询问句对应的知识图谱子图,实现对学术查询中意图的正确判定,可用于基本学术信息查询场景。
本发明涉及一种基于语义组件的学术知识问答方法及系统,其中,知识图谱采用资源描述框架(Resource Description Framework,RDF)的数据模型,使用N-Triples数据格式描述学术领域信息与信息之间的关系,即通过定义知识图谱中针对学术领域的实体和实体所属的域、所属域下的主题类型以及主题类型中包含的关系,构成层级数据划分,实现对数据的管理。
本发明涉及的域的定义有“作者”域、“机构”域、“领域”域、“期刊”域和“文献”域,其中“机构”域下细分为高校、科研机构和公司等多种类型,高校类型下具有名称、研究方向等多种关系,“文献”域下具有学术论文类型、硕博论文等多种类型。本发明涉及的知识库包括领域知识图谱、同义词映射库和属性知识图谱,其中领域知识图谱用于存储五个学术信息域中实体之间关系的三元组,同义词映射库为领域内标准词与别名词之间的映射表,属性知识图谱用于存储五个学术信息域中实体的属性以及属性值并表示为约束信息。
本发明涉及一种基于语义组件的子图构建技术,首先将用户提出的查询问句分解为语义组件;利用语义组件对预先构建的知识图谱进行过滤,得到查询问句对应的知识图谱子图,从而实现对学术查询问句中意图的正确判定。
本发明采用的技术方案,其特征为:首先利用学术研究者在互联网上公开的学术信息,构建领域内知识图谱、同义词映射库和属性知识图谱。然后,通过同义词映射库,将查询问句中的词语替换为标准词,再对其进行预处理和实体识别,其中预处理解析为约束语义组件和意图语义组件,实体识别得到查询问句中属于学术领域的实体,从而得到与实体相连的关系集;进一步,利用意图语义组件计算关系和查询问句的相似度,若相似度排名小于预定义的阈值,则视该关系和查询意图相关,并保留关系为路径,否则丢弃关系,迭代扩展路径后,得到学术查询问句的子图;利用约束语义组件,从属性知识图谱中为子图添加约束信息。最后将得到的子图作为查询的学术信息结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211018126.2/2.html,转载请声明来源钻瓜专利网。