[发明专利]数据搜索方法及装置、电子设备、存储介质在审

专利信息
申请号: 201810410063.2 申请日: 2018-05-02
公开(公告)号: CN110457339A 公开(公告)日: 2019-11-15
发明(设计)人: 刘继宇;邵荣防;郝晖;谢群群 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F16/242 分类号: G06F16/242;G06F16/21;G06F16/2455
代理公司: 11438 北京律智知识产权代理有限公司 代理人: 阚梓瑄;王卫忠<国际申请>=<国际公布>
地址: 100195北京市海淀区杏石口路65*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索数据 数据搜索 近义词 相似度 电子商务技术 词义 存储介质 电子设备 搜索结果 准确率 搜索 返回
【说明书】:

本公开是关于一种数据搜索方法及装置、电子设备、存储介质,涉及电子商务技术领域,该方法包括:获取搜索数据;通过词形和词义计算所述搜索数据与多个历史搜索数据之间的相似度;通过所述相似度从所述历史搜索数据中确定所述搜索数据的近义词;根据所述近义词进行搜索,以返回搜索结果。本公开能够提高数据搜索准确率。

技术领域

本公开涉及电子商务技术领域,具体而言,涉及一种数据搜索方法、数据搜索装置、电子设备以及计算机可读存储介质。

背景技术

随着互联网技术的快速发展,用户通过网络进行搜索的需求逐渐提高。由于用户的搜索查询query会存在多样性,同时有些用户的搜索query系统无法识别,因此如何根据用户搜索的query挖掘出用户真实的意图是急需解决的问题。

为了解决上述问题,相关技术中在接收到用户输入的搜索词之后,通过正则表达式匹配的方法获取搜索词的近义词。正则表达式指的是对字符串和特殊字符操作的一种逻辑公式,其只可以在搜索查询query的形式比较相似时才可以使用。

上述方式中,由于正则表达式不能从搜索词的词义层面确定其近义词,也不能确定缩写形式的搜索词的近义词,因此导致确定的近义词不准确,进而影响数据搜索的准确率,与此同时,由于不能准确确定近义词,导致搜索过程效率较低;除此之外,由于正则表达式的局限性,导致数据搜索的应用范围受到限制,因此降低了用户满意度和用户体验。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种数据搜索方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的数据搜索不准确的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开的一个方面,提供一种数据搜索方法,包括:获取搜索数据;通过词形和词义计算所述搜索数据与多个历史搜索数据之间的相似度;通过所述相似度从所述历史搜索数据中确定所述搜索数据的近义词;根据所述近义词进行搜索,以返回搜索结果。

在本公开的一种示例性实施例中,通过词形和词义计算所述搜索数据与多个历史搜索数据之间的相似度包括:对所述搜索数据进行分词处理,以获取第一词序列;对所述历史搜索数据进行分词处理,以获取第二词序列;通过词形和词义计算所述第一词序列与所述第二词序列之间的相似度。

在本公开的一种示例性实施例中,通过词形和词义计算所述第一词序列与所述第二词序列之间的相似度包括:计算所述第一词序列与所述第二词序列之间的匹配度;计算所述第一词序列与所述第二词序列之间的编辑距离;确定所述第一词序列与所述第二词序列之间的词义相似度。

在本公开的一种示例性实施例中,所述匹配度的计算公式包括:

s=Pi/len(term),

其中,s为匹配度,Pi为第一词序列与第二词序列中相同词的数量,len(term)为第一词序列中词的数量。

在本公开的一种示例性实施例中,所述编辑距离的计算公式包括:

d=0.1×Edit(a,b),

其中,a为第一词序列,b为第二词序列。

在本公开的一种示例性实施例中,确定所述第一词序列与所述第二词序列之间的词义相似度包括:通过将第一词序列中的每个词输入一搜索词模型,以确定第一词序列的目标向量;计算所述目标向量与第二词序列的参考向量之间的余弦相似度,以得到所述词义相似度。

在本公开的一种示例性实施例中,所述余弦相似度的计算公式包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810410063.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top