[发明专利]一种基于Bi-LSTM和中文知识图谱的复合问答方法有效
申请号: | 202110701932.9 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113449117B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 刘玮;兰剑;陈灯;王宁;华鑫;张俊杰;胡杨杨 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/211;G06F40/30;G06F18/2415;G06N3/0442;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bi lstm 中文 知识 图谱 复合 问答 方法 | ||
本发明提供了一种基于Bi‑LSTM和中文知识图谱的复合问答方法,通过将语义解析技术改进并引入问答系统,使用基于深度学习的复合问句分解方法,将复杂的长难句改写为多个简单句并分别作答,提高了语义解析技术对复合问题的处理能力,实现了解析复合自然语言问句和生成复合自然语言答案的功能,提高了问答系统的智能理解能力、准确率,使问答系统处理复合问句的过程具有可解释性,丰富了原复合问句的语义信息,去除了原复合问句的冗余信息,解决了难以回答句式结构复杂、主题多样复杂问句的问题和复合答案生成中的答案信息丢失的问题。
技术领域
本发明属于计算机人工智能应用技术领域,具体涉及一种基于Bi-LSTM和中文知识图谱的复合问答方法。
背景技术
问答系统(Question Answering System,QA)建立了自然语言与机器语言的沟通桥梁,作为人机交互的重要途径,其本质是一种高级信息检索形式,可以帮助用户从海量知识中提取相关信息。随着人工智能的高速发展和广泛普及,问答系统作为一种人工智能的表现形式,被广泛应用于法律推荐、医疗诊断、搜索引擎、客服等行业中。
传统的问答系统仅能对句长较短、主题单一的简单问句进行准确回答,而对于较复杂的问句无法有效理解和回答,其原因在于语义解析技术的不足。传统问句解析方法主要由三部分组成:一是意图识别,识别用户的目的,以确定答案搜索的领域。二是关键信息提取,通过机器学习等方法,识别问句中实体、实体关系等关键信息,作为答案搜索的基本依据。三是信息增强,从外源知识中提取与问句相关的信息,扩展答案搜索的范围。然而此种解析方法无法满足理解复杂长难句的需求,其原因有三点:在较长的问句中,关键信息较多,使用神经网络模型进行实体抽取时会遗漏关键信息;长难句中的三元组匹配度差,导致无法在知识图谱中进行实体、实体关系搜索;当前问句解析方法无法从句式的角度理解长难句,导致面对复杂的问句结构时,无法构筑针对性答案。
发明内容
本发明要解决的技术问题是:提供一种基于Bi-LSTM和中文知识图谱的复合问答方法,用于解析复合自然语言问句和生成复合自然语言答案。
本发明为解决上述技术问题所采取的技术方案为:一种基于Bi-LSTM和中文知识图谱的复合问答方法,包括以下步骤:
S01:向问答系统输入复合问题;
S02:采用Bi-LSTM模型解析复合问题并分解为n个子问题;
S03:将n个子问题组成子问题集;
S04:提取并分析子问题集的第n个子问题的关键信息;
S05:根据第n个子问题的关键信息在中文知识图谱中搜索答案;
S06:在问答系统返回的多个相关的子答案中抽取m个子答案;
S07:将m个子答案组成第n个子问题对应的答案集;
S08:对答案集中的所有答案进行摘要得到答案集的摘要答案,将摘要答案作为第n个子问题对应的子答案;
S09:重复步骤S04~S08直至子问题集遍历完成;
S10:合并每个子问题对应的子答案,得到原复合问题的子答案集;
S11:将子答案集中的答案组合生成原复合问句的最终答案。
按上述方案,所述的步骤S02中,具体步骤为:
S021:采用Bi-LSTM模型将复合问题分类为嵌套类复合问题、句法并列类复合问题、修饰并列类复合问题、域约束修饰类复合问题、冗余类复合问题;
S022:按复合问句的种类选择对应的问题解析方法,将复合问句分解为n个子问题。
进一步的,所述的步骤S021中,具体步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110701932.9/2.html,转载请声明来源钻瓜专利网。