[发明专利]一种面向多轮查询的领域识别方法及系统有效
申请号: | 201811082183.0 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109241265B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 许洛;谭斌;孙锐;展华益;王欣;杨兰;饶璐 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/289 |
代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 吴瑞芳 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 查询 领域 识别 方法 系统 | ||
1.一种面向多轮查询的领域识别方法,其特征在于,包括以下步骤:
A.获取待识别的当前查询文本并判断是否存在上文查询文本,若存在,则获取上文查询文本,否则,将当前查询文本同时作为上文查询文本;
B.对所述当前查询文本和所述上文查询文本作分字或分词处理得到当前查询文本的字串或词串以及上文查询文本的字串或词串;
C.对所述当前查询文本的字串或词串以及上文查询文本的字串或词串做同维度向量表示,分别得到当前查询文本对应的向量表示及上文查询文本对应的向量表示;
D.将当前查询文本对应的向量表示及上文查询文本对应的向量表示作为神经网络模型的输入信息;
E.神经网络模型在输入信息组合后的组合信息中得到当前查询文本所属领域;所述步骤E中输入信息组合的组合方式包括:向量的拼接、带权重的加和、向量对应位置处取最大值;输入信息组合具体为当前查询文本对应的向量表示与上文查询文本对应的向量表示的组合或在神经网络中当前查询文本及上文查询文本对应的隐层向量的组合;
当所述步骤E中输入信息组合为当前查询文本及上文查询文本对应的向量表示的组合时,所述步骤E具体包括以下步骤:
S1.1将当前查询文本对应的向量表示及上文查询文本对应的向量表示组合成一个新向量;
S1.2将组合得到的新向量作为神经网络的输入送入到神经网络的输入层并进行神经网络的运算;
S1.3从神经网络的输出结果中得到当前查询文本所属领域的Top-k结果,选取概率最大的作为当前查询文本的所属领域。
2.根据权利要求1所述的一种面向多轮查询的领域识别方法,其特征在于,所述神经网络模型采用卷积神经网络、单向循环神经网络或双向循环神经网络。
3.根据权利要求2所述的一种面向多轮查询的领域识别方法,其特征在于,所述神经网络模型采用卷积神经网络时,当所述步骤E中输入信息组合为在神经网络中当前查询文本及上文查询文本对应的隐层向量的组合时,所述步骤E具体包括以下步骤:
S2.1将当前查询文本对应的向量表示及上文查询文本对应的向量表示分别作为一个输入送入到卷积神经网络的输入层;
S2.2在卷积神经网络中,分别将当前查询文本对应的向量表示及上文查询文本对应的向量表示经过若干的神经网络层计算,包括卷积神经网络的卷积池化操作、循环神经网络的隐藏层计算,分别得到当前查询文本对应的全连接层向量及上文查询文本对应的全连接层向量;
S2.3在全连接层中将当前查询文本对应的全连接层向量及上文查询文本对应的全连接层向量进行组合得到新向量;
S2.4将所述新向量经过dropout操作后送入激活函数;
S2.5将激活函数输出的结果输入到全连接层来调整向量维度后再送入softmax分类器进行领域类别分类;
S2.6从卷积神经网络的输出结果中得到当前查询文本所属领域的Top-k结果,选取概率最大的作为当前查询文本的所属领域。
4.一种面向多轮查询的领域识别系统,用于实现如权利要求1所述的一种面向多轮查询的领域识别方法,其特征在于,包括:
获取模块,用于获取待识别的当前查询文本,及在当前查询文本存在上文查询文本时提取上文查询文本;
向量表示模块,用于对当前查询文本和上文查询文本作分字或分词处理从而得到字串或者词串,并对得到字串或词串作相应的同维度向量表示分别得到当前查询文本对应的向量表示及上文查询文本对应的向量表示;
领域识别模块,用于将所述当前查询文本对应的向量表示及上文查询文本对应的向量表示作为神经网络信息组合模型的输入信息,并从神经网络信息组合模型的输出结果中确定当前查询文本所属领域;
神经网络信息组合模型,神经网络信息组合模型嵌于领域识别模块内,用于对输入信息进行处理并在输入信息组合后的组合信息中得到当前查询文本所属领域并输出,其中,所述输入信息组合具体为当前查询文本对应的向量表示与上文查询文本对应的向量表示的组合或在神经网络中当前查询文本及上文查询文本对应的隐层向量的组合;
其中,向量表示模块的输入端与获取模块相连,向量表示模块的输出端与领域识别模块相连。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811082183.0/1.html,转载请声明来源钻瓜专利网。