[发明专利]基于QA知识库推理的多轮对话回复选择方法、系统有效
申请号: | 201910192600.5 | 申请日: | 2019-03-14 |
公开(公告)号: | CN110096567B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 向露;刘洋;周玉;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/332 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 qa 知识库 推理 轮对 回复 选择 方法 系统 | ||
1.一种基于QA知识库推理的多轮对话回复选择方法,其特征在于,包括以下步骤:
对当前多轮对话进行关键词提取,获取第一关键词组合;
以所述第一关键词组合、当前输入作为问题,从QA知识库中检索出候选问题集合,并获取各候选问题相应的上下文,构建候选多轮对话集合;所述QA知识库基于预先获取的多轮对话数据集进行构建;
计算所述当前输入与所述候选问题集合中各候选问题的语义相似度,作为对应的候选问题与当前输入的第一相似度;
计算所述当前输入的上下文与所述候选问题集合中各候选问题上下文的语义相似度,作为对应的候选问题与当前输入的第二相似度;
计算当前多轮对话的摘要信息与所述候选多轮对话集合中各候选多轮对话的摘要信息的相似度,作为对应的候选问题与当前输入的第三相似度;
基于第一相似度、第二相似度、第三相似度,通过加权求和的方式计算得到候选问题集合中各候选问题与当前输入的相似度,选取相似度最大的候选问题对应的回复作为当前输入的回复。
2.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,“对当前多轮对话进行关键词提取”,其方法为:
对当前正在进行的多轮对话进行关键词抽取,并选取其中词性为名词和动词的关键词作为所提取的关键词。
3.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,“构建候选多轮对话集合”,其方法为:
根据所述第一关键词组合对QA知识库进行检索,获得包含所述第一关键词组合中关键词的多轮对话,作为第一多轮对话集合;
根据当前输入对QA知识库进行检索,得到与当前输入最相似的N个候选句子及包含该句子的多轮对话,作为第二多轮对话集合;
对第一多轮对话集合和第二多轮对话集合取交集,得到候选问题集合和候选多轮对话集。
4.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,所述第二相似度,其计算方法为:
通过循环神经网络获取当前输入的上下文的语境分布式表达,作为第一语境分布式表达;
通过循环神经网络分别获取所述候选问题集合中各候选问题的上下文的语境分布式表达,作为第二语境分布式表达;
分别计算所述第一语境分布式表达和所述第二语境分布式表达的相似度,作为对应的候选问题与当前输入的第二相似度。
5.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,所述第三相似度,其计算方法为:
对当前多轮对话进行摘要抽取,获得当前多轮对话的摘要信息;
分别对所述候选多轮对话集合中各候选多轮对话进行摘要抽取,获得每个候选多轮对话的摘要信息;
分别计算当前多轮对话的摘要信息与所述候选多轮对话集合中各候选多轮对话的摘要信息的相似度,作为对应的候选问题与当前输入的第三相似度。
6.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,“通过加权求和的方式计算得到候选问题集合中各候选问题与当前输入的相似度”,其方法为:
其中,为所计算的候选问题与当前输入的相似度,是候选问题与当前输入的第一相似度,Sim(Ck,Di)是候选问题与当前输入的第二相似度,是候选问题与当前输入的第三相似度,λ1、λ2、λ3分别为预设的加权系数。
7.根据权利要求1-6任一项所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,所述QA知识库,其构建方法为:
对预先获取的多轮对话数据集进行分词、关键词抽取;
使用关键词对多轮对话数据集建立索引,存储关键词及包含该关键词的多轮对话的ID;
对每一个多轮对话,将其中的每一句话建立倒排索引,存储包含所述关键词的句子、该句子所属多轮对话的ID以及该句子在多轮对话中的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910192600.5/1.html,转载请声明来源钻瓜专利网。