[发明专利]问答匹配系统和方法及问答处理设备和介质有效
申请号: | 201811340892.4 | 申请日: | 2018-11-12 |
公开(公告)号: | CN111177328B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 方晗吟;刘洋;蒋冠军 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33;G06N3/0464 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 匹配 系统 方法 处理 设备 介质 | ||
1.一种问答匹配系统,用于针对用户的问询来提供匹配的答案,其特征在于,该系统包括卷积神经网络,所述卷积神经网络包括:
分别处于问询侧和答案侧的词嵌入层,被配置为在该层利用预训练的用于表述基础特征的统一词向量来对输入的问询和对应于该问询的至少一个备选答案之一分别进行初始化,以得到所述问询和相应备选答案的向量表述;
分别处于问询侧和答案侧的卷积层,被配置为对所述的问询的特征表述和所述相应备选答案的特征表述进行卷积操作以提取特征;以及
全连接层,经过卷积层卷积之后的问询侧和答案侧的卷积结果均输入全连接层,并从全连接层输出匹配结果,
其中,所述问询侧和答案侧的两个词嵌入层共享预训练的所述词向量,而所述问询侧和答案侧的两个卷积层不共享配置参数,
所述问答匹配系统还包括数据集构建模块,该数据集构建模块被配置为从已有的问答数据中获取问询和与其对应的最佳答案并组成一对正样本,并将从问答数据中非该问询的答案中随机采样到的答案作为负样本,还从问答数据中采样与该问询的字面相似的答案作为负样本,从而构造出该问询对应的数据集,并将构造的数据集应用于所述卷积神经网络,
所述问答匹配系统还包括词向量预训练模块,该词向量预训练模块被配置为收集用户输入的问询数据作为训练词向量的一个语料来源,然后结合作为训练词向量的另一个语料来源的百科数据,采用词向量嵌入方法来训练得到词向量。
2.根据权利要求1所述的问答匹配系统,其特征在于,所述问答匹配系统利用预先构造的数据集中的正负样本作为训练数据来端到端地训练卷积神经网络模型,由此得到与用户的问询匹配的答案。
3.根据权利要求1所述的问答匹配系统,其特征在于,所述词向量预训练模块在收集用户问询时,根据查询次数来过滤问询。
4.一种问答匹配方法,用于针对用户的问询来提供匹配的答案,其特征在于,该方法基于卷积神经网络,包括:
利用预训练的用于表述基础特征的统一词向量来对用户输入的问询和对应于该问询的至少一个备选答案之一分别进行初始化,以得到所述问询和相应备选答案的向量表述;
对所述问询的特征表述和所述相应备选答案的特征表述分别进行卷积操作以提取特征;以及
将所述问询的特征表述和所述相应备选答案的特征表述的卷积结果映射到样本标记空间,从而得到所述问询的匹配结果,
其中,所述问询的特征表述的卷积操作不与所述相应备选答案的特征表述的卷积操作共享配置参数;
所述问答匹配方法还包括:
从已有的问答数据中获取问询和与其对应的最佳答案并组成一对正样本,并将从问答数据中非该问询的答案中随机采样到的答案作为负样本,还从问答数据中采样与该问询的字面相似的答案作为负样本,从而构造出该问询对应的数据集,并将构造的数据集应用于所述卷积神经网络;
收集用户输入的问询数据作为训练词向量的一个语料来源,然后结合作为训练词向量的另一个语料来源的百科数据,采用词向量嵌入方法来训练得到所述词向量。
5.根据权利要求4所述的问答匹配方法,其特征在于,所述问答匹配方法利用预先构造的数据集中的正负样本作为训练数据来端到端地训练卷积神经网络模型,由此得到与用户的问询匹配的答案。
6.根据权利要求4所述的问答匹配方法,其特征在于,在收集用户的问询时,根据查询次数来过滤问询。
7.一种问答处理设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求4~6中任何一项所述的方法。
8.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被语音处理设备的处理器执行时,使所述处理器执行如权利要求4~6中任何一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811340892.4/1.html,转载请声明来源钻瓜专利网。