[发明专利]一种基于分阶段查询的知识图谱常识问答方法及系统有效
申请号: | 202110410370.2 | 申请日: | 2021-04-16 |
公开(公告)号: | CN112989005B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 唐昌伦;赵卓;田侃;张殊;张晨;吴涛;张浩然;王宇轩 | 申请(专利权)人: | 重庆中国三峡博物馆;重庆邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F16/36;G06F40/14;G06F40/247;G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400015 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分阶段 查询 知识 图谱 常识 问答 方法 系统 | ||
本发明属于知识图谱自动问答领域,具体涉及一种基于分阶段查询的知识图谱常识问答方法及系统,包括:获取问题语句,对问题语句进行预处理,转化为问句序列;将问句序列输入到训练好的改进的问答模型中,得到问答结果;改进的问答模型包括实体识别模型、约束语识别模型以及问题结构分类模型;本发明将复杂问题或简单问题转化成基于语句结构的问题语义结构树,通过更新待定节点一步步寻找问题答案,从繁琐到简单,把查找过程简单化。
技术领域
本发明属于知识图谱自动问答领域,具体涉及一种基于分阶段查询的知识图谱常识问答方法及系统。
背景技术
近几年来,随着人工智能的迅速发展,其最具代表性的智能问答,频繁的出现在人们的视野里。这离不开以知识图谱为代表的知识工程领域的发展,知识图谱以三元组的形式存储数据。知识图谱当中存储以“头实体-关系-尾实体”的三元组,在其中实体为节点,关系作为边,呈现出带有节点、连接边信息的网络结构图。知识图谱可以应用于很多领域,如医疗,军事,文博,金融,建筑等,是当今社会不可缺少的重要技术。随着知识图谱的提出,基于知识图谱的问答技术应运而生,越来越多的行业离不开以自然语言处理和知识图谱支持的自动问答技术。基于知识图谱建立的知识库应用于常识性自动问答系统,可以有效的满足当今各行业的智能化发展,受到广大的关注。
现有的基于知识图谱的问答技术当中,大多都是解决简单问题,简单问题只需要通过简单的自然语言处理,而后识别出问句当中的实体和谓语,转换为查询语言之后就可以在知识图谱当中寻找到答案。解决简单问题的知识图谱问答技术不能解决复杂问题。除了解决简单问题问答系统,现在有极少数的像基于查询图的查找技术,可以解决复杂问题,但是此类技术的问题是计算量很大,并且在其过程当中,存在着难以准确地做到修枝等问题。
发明内容
为解决以上现有技术存在的问题,本发明提出了一种基于分阶段查询的知识图谱常识问答方法,该方法包括:获取问题语句,对问题语句进行预处理,转化为问句序列;将问句序列输入到训练好的改进的问答模型中,得到问答结果;改进的问答模型包括实体识别模型、约束语识别模型以及问题结构分类模型;
对改进的问答模型进行训练和搭建的过程包括:
S1:获取原始问句数据集,并对数据集中的数据进行预处理,得到训练集;
S2:将训练集中的数据输入到训练好的实体识别模型中,得到标记出实体的数据;
S3:将标记出实体的数据输入到训练好的约束语识别模型中,得到标记出实体和约束条件的数据;
S4:将标记出实体和约束条件的数据输入到问题结构分类模型中进行分类,根据问句分类结果;根据分类结果建立问题分类列表和语义结构树模板列表;
S5:采用语义结构树模板列表对问题分类列表中的每一类问题句中的主语、约束语个数以及约束语的层次结构进行处理,得到各类问题模板的语义结构树;
S6:采用知识图谱对答案查找模块中的各个节点进行分别查询更新;将各类问题模板的语义结构树输入到更新后的答案查找模块中,当检测到待定节点为叶子节点时,则该节点为问题的答案;
S7:将全部待定节点更新完成后,将每一个待定节点更新的解释作为问题解答步骤和问题的答案一同返回,作为输入问题的解答,完成模型的训练。
优选的,对问题语句进行预处理的过程包括:去除原始问句数据集中的特殊字符,删除重复的问句数据,并对问句进行分词操作,得到训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆中国三峡博物馆;重庆邮电大学,未经重庆中国三峡博物馆;重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110410370.2/2.html,转载请声明来源钻瓜专利网。