[发明专利]一种对话问答方法、装置、设备及存储介质有效
申请号: | 201811139032.4 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109344242B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 何健聪;周郭许 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 问答 方法 装置 设备 存储 介质 | ||
1.一种对话问答方法,其特征在于,包括:
获取用户输入的目标信息;
判断目标数据库的历史对话中是否存在与所述目标信息相匹配的历史信息;
若存在与所述目标信息相匹配的历史信息,则确定与所述目标信息相匹配的历史信息对应的历史答案为所述目标信息的目标答案;
若所述目标信息为文字信息,则所述判断目标数据库的历史对话中是否存在与所述目标信息相匹配的历史信息包括:
利用Bi-LSTM对目标信息进行编码,得到目标编码向量;
判断所述目标数据库的历史对话中是否存在与所述目标编码向量相匹配的历史编码向量;
若所述目标编码向量与所述历史编码向量的匹配度大于阈值,则所述目标信息与所述历史信息相匹配;
所述判断所述目标数据库的历史对话中是否存在与所述目标编码向量相匹配的历史编码向量包括:用户输入目标信息时,从历史对话中查找是否存在与用户提出的目标信息相匹配的历史信息,在用户输入的历史对话中包含用户输入的问题和所述问题对应的历史答案,历史信息和与历史信息对应的历史答案按照键值对的方式进行存储:对于历史对话,所述历史对话包含:历史信息和历史答案,将历史对话先转换为一个三维的向量,所述三维向量可以采用DH= (X,W,E)进行表示,其中,X指的是所有的对话历史,W指的是对话历史中每轮对话的系列词,每轮对话的系列词可以采用W={w1,...,wn}进行表示,w指的是每轮对话中的分词;
其中,对话历史中的每轮对话作为一个集合组成向量矩阵,所述向量矩阵表示为:D={D1,...,DN},对于每一轮对话Di都由不同的分词进行表示,即上述的W={w1,...,wN},每轮对话的每个分词按照词向量进行编码得到编码向量集合E={e1,...,ev},对于三维张量利用LSTM和CNN对三维张量DH进行编码,利用LSTM对三维张量进行编码后,得到所有历史对话中每轮历史对话的编码向量组合利用CNN对三维张量进行编码后,得到所有历史对话中每轮历史对话的编码向量组合
其中,M集合中的各元素代表的是经LSTM编码后的每轮对话的编码向量,C结合中的各元素代表的是经CNN编码后的每轮对话的编码向量。
2.根据权利要求1所述的对话问答方法,其特征在于,若目标数据库中不存在与所述目标信息匹配的历史信息,还包括:
判断所述目标数据库中是否存在与所述目标信息相关联的关联历史信息;
若是,则根据所述目标信息和所述关联历史信息在所述目标数据库查找与所述目标信息对应的答案。
3.根据权利要求1所述的对话问答方法,其特征在于,若目标数据库中不存在与所述目标信息匹配的历史信息,还包括:
在所述目标数据库中查找与所述目标信息对应的目标答案。
4.根据权利要求3所述的对话问答方法,其特征在于,所述在所述目标数据库中查找与所述目标信息对应的目标答案包括:
利用Bi-LSTM对目标信息进行编码,得到目标编码向量;
在目标数据库中查找与所述目标编码向量对应的键值对;
若所述键值对与所述目标编码向量相匹配,则将与所述键值对对应的目标信息作为所述目标答案。
5.根据权利要求4所述的对话问答方法,其特征在于,所述在目标数据库中查找与所述目标编码向量对应的键值对包括:
确定所述目标数据库中的键和值;
根据所述键和所述目标编码向量为所述值分配相关概率;
利用所述相关概率对所述值进行加权求和得到加权和值;
将所述目标编码向量和所述加权和值进行整合得到整合向量,将所述整合向量作为与所述目标编码向量对应的键值对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811139032.4/1.html,转载请声明来源钻瓜专利网。