[发明专利]根据用户问句召回标准问句的方法和装置有效

专利信息
申请号: 201910635574.9 申请日: 2019-07-15
公开(公告)号: CN110413750B 公开(公告)日: 2023-05-23
发明(设计)人: 刘俊宏;温祖杰 申请(专利权)人: 创新先进技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06N3/0464;G06N3/08
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 孙欣欣;周良玉
地址: 开曼群岛大开曼岛*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 根据 用户 问句 召回 标准 方法 装置
【权利要求书】:

1.一种根据用户问句召回标准问句的方法,所述方法包括:

针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;

将所述分词集合作为预先训练的第一卷积神经网络CNN模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;

获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;

根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句;

其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型DSSM模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。

2.如权利要求1所述的方法,其中,所述第一CNN模型或所述第二CNN模型采用如下至少一种滑动窗口:

一个分词的滑动窗口、两个分词的滑动窗口和三个分词的滑动窗口。

3.如权利要求1所述的方法,其中,对所述DSSM模型进行训练的方式如下:

将历史用户问句对应的分词集合作为所述第一CNN模型的样本输入,将针对所述历史用户问句召回的历史标准问句作为所述第二CNN模型的样本输入,根据用户对历史标准问句的点击结果生成所述DSSM模型的样本标签,对所述DSSM模型进行训练。

4.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句,包括:

通过余弦相似度或欧式距离确定所述第一句子表示向量与各第二句子表示向量之间的相似度;

获取排序在前预定数目位的相似度对应的第二句子表示向量,将获取的第二句子表示向量对应的标准问句确定为召回的标准问句。

5.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句,包括:

获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量;

将预定数目个第二句子表示向量对应的标准问句确定为召回的标准问句。

6.如权利要求5所述的方法,其中,所述获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量,包括:

在所述第一句子表示向量与各第二句子表示向量构成的向量空间中,基于对所述向量空间的划分,获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量。

7.如权利要求1所述的方法,其中,所述根据所述第一句子表示向量与各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句之后,所述方法还包括:

通过余弦相似度或欧式距离确定所述第一句子表示向量与召回的标准问句对应的各第二句子表示向量之间的相似度。

8.一种根据用户问句召回标准问句的装置,所述装置包括:

分词单元,用于针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;

生成单元,用于将所述分词单元得到的分词集合作为预先训练的第一卷积神经网络CNN模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;

获取单元,用于获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;

确定单元,用于根据所述生成单元得到的第一句子表示向量与所述获取单元获取的各第二句子表示向量之间的相似度或向量距离的排序,确定召回的标准问句;

其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型DSSM模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。

9.如权利要求8所述的装置,其中,所述第一CNN模型或所述第二CNN模型采用如下至少一种滑动窗口:

一个分词的滑动窗口、两个分词的滑动窗口和三个分词的滑动窗口。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910635574.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top