[发明专利]基于词向量的搜索方法、终端、服务器及存储介质在审

专利信息
申请号: 202110277854.4 申请日: 2021-03-15
公开(公告)号: CN112988971A 公开(公告)日: 2021-06-18
发明(设计)人: 颜泽龙;王健宗;吴天博;程宁 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/284;G06F40/289;G06K9/62
代理公司: 深圳市力道知识产权代理事务所(普通合伙) 44507 代理人: 张传义
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 向量 搜索 方法 终端 服务器 存储 介质
【说明书】:

本申请涉及语音语义技术领域,并公开了一种基于词向量的搜索方法、终端、服务器及存储介质,所述方法包括:响应于用户输入的索引内容,确定所述索引内容的关键词;分别在预先存储的倒排索引表中查找各个所述关键词的词向量;计算各个所述词向量与所有目标长文本之间的相似度,所述目标长文本为预先存储的与所述索引内容关联的所有长文本;基于所述相似度显示与所述索引内容相匹配的搜索结果;所述预先存储的与所述索引内容关联的所有长文本由服务端基于XL I NE模型对所述索引内容进行分析,得到的包含有所述索引内容的关键词的所有长文本。能够保证搜索精度的同时不增加计算开销。

技术领域

本申请涉及语音语义技术领域,尤其涉及一种基于词向量的搜索方法、终端、服务器及存储介质。

背景技术

目前,常见的搜索算法包括基于tf-idf的搜索算法、基于图推荐TextRank的搜索算法或基于词向量的搜索算法。其中,基于tf-idf的搜索算法虽然具有速度快的优势,但是由于基于tf-idf的搜索算法没有考虑到词与词以及词与句子之间的关系,导致搜索结果的精度不高。而基于图推荐TextRank的搜索算法虽然考虑到词与词之间的权重转移,却仍然是基于词粒度,没有考虑到上下文之间的深层语义联系。另外,基于词向量的方法可以一定程度上缓解搜索同义词的匹配问题但是会给搜索带来很大的开销。与tf-idf的倒排索引不同的是,词向量需要搜索的query与库中每一个话术的向量进行余弦相似度计算,会带来巨大的计算开销。

因此,现有的搜索算法存在搜索精度不高或者是计算开销大的问题。

发明内容

本申请提供了一种基于词向量的搜索方法、终端、服务器及存储介质,能够在保证搜索精度的同时不增加计算开销。

第一方面,本申请提供了一种基于词向量的搜索方法,应用于终端,所述方法包括:

响应于用户输入的索引内容,确定所述索引内容的关键词;

分别在预先存储的索引表中查找各个所述关键词的词向量;

计算各个所述词向量与所有目标长文本之间的相似度,所述目标长文本为预先存储的与所述索引内容关联的所有长文本,所述预先存储的与所述索引内容关联的所有长文本由服务器基于XLINE模型对所述索引内容进行分析,得到的包含所述索引内容的各个所述关键词的词向量文本;

基于所述相似度显示与所述索引内容相匹配的搜索结果。

第二方面,本申请还提供了一种基于词向量的搜索方法,应用于服务器,所述方法包括:

获取用户在终端输入的索引内容;

根据预先训练完成的XLIN模型对所述索引内容进行分析,得到包含所述索引内容的各个关键词的词向量文本;

将所述索引内容的各个关键词的词向量文本以所述索引内容的目标长文本发送至所述终端,所述目标长文本用于指示所述终端确定所述索引内容的关键词的词向量,并计算确定的各个所述词向量与所有所述目标长文本之间的相似度,基于所述相似度显示与所述索引内容相匹配的搜索结果。

第三方面,本申请还提供了一种终端,所述终端包括:

确定模块,用于响应于用户输入的索引内容,确定所述索引内容的关键词;

查找模块,用于分别在预先存储的索引表中查找各个所述关键词的词向量;

计算模块,用于计算各个所述词向量与所有目标长文本之间的相似度,所述目标长文本为预先存储的与所述索引内容关联的所有长文本,所述预先存储的与所述索引内容关联的所有长文本由服务器基于XLINE模型对所述索引内容进行分析,得到的包含所述索引内容的各个所述关键词的词向量文本;

显示模块,用于基于所述相似度显示与所述索引内容相匹配的搜索结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110277854.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top