[发明专利]根据用户问句召回标准问句的方法和装置有效
申请号: | 201910635574.9 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110413750B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 刘俊宏;温祖杰 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06N3/0464;G06N3/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 用户 问句 召回 标准 方法 装置 | ||
1.一种根据用户问句召回标准问句的方法,所述方法包括:
针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;
将所述分词集合作为预先训练的第一卷积神经网络CNN模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;
获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;
根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句;
其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型DSSM模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。
2.如权利要求1所述的方法,其中,所述第一CNN模型或所述第二CNN模型采用如下至少一种滑动窗口:
一个分词的滑动窗口、两个分词的滑动窗口和三个分词的滑动窗口。
3.如权利要求1所述的方法,其中,对所述DSSM模型进行训练的方式如下:
将历史用户问句对应的分词集合作为所述第一CNN模型的样本输入,将针对所述历史用户问句召回的历史标准问句作为所述第二CNN模型的样本输入,根据用户对历史标准问句的点击结果生成所述DSSM模型的样本标签,对所述DSSM模型进行训练。
4.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句,包括:
通过余弦相似度或欧式距离确定所述第一句子表示向量与各第二句子表示向量之间的相似度;
获取排序在前预定数目位的相似度对应的第二句子表示向量,将获取的第二句子表示向量对应的标准问句确定为召回的标准问句。
5.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句,包括:
获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量;
将预定数目个第二句子表示向量对应的标准问句确定为召回的标准问句。
6.如权利要求5所述的方法,其中,所述获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量,包括:
在所述第一句子表示向量与各第二句子表示向量构成的向量空间中,基于对所述向量空间的划分,获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量。
7.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句之后,所述方法还包括:
通过余弦相似度或欧式距离确定所述第一句子表示向量与召回的标准问句对应的各第二句子表示向量之间的相似度。
8.一种根据用户问句召回标准问句的装置,所述装置包括:
分词单元,用于针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;
生成单元,用于将所述分词单元得到的分词集合作为预先训练的第一卷积神经网络CNN模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;
获取单元,用于获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;
确定单元,用于根据所述生成单元得到的第一句子表示向量与所述获取单元获取的各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句;
其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型DSSM模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。
9.如权利要求8所述的装置,其中,所述第一CNN模型或所述第二CNN模型采用如下至少一种滑动窗口:
一个分词的滑动窗口、两个分词的滑动窗口和三个分词的滑动窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910635574.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:确定标准问题的方法及装置
- 下一篇:药品搜索方法、装置、终端设备以及存储介质