[发明专利]商品搜索数据处理方法、装置、设备及存储介质有效

专利信息
申请号: 202110198979.8 申请日: 2021-02-23
公开(公告)号: CN112818088B 公开(公告)日: 2023-09-29
发明(设计)人: 谷坤;蒋贝贝 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/295;G06F40/44;G06N3/0442;G06N3/084;G06Q30/0601
代理公司: 北京市京大律师事务所 11321 代理人: 姚维
地址: 518033 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 商品 搜索 数据处理 方法 装置 设备 存储 介质
【说明书】:

发明涉及大数据领域,公开了一种商品搜索数据处理方法、装置、设备及存储介质。该方法包括:获取用户输入的商品搜索语句;将所述商品搜索语句输入预置实体词提取模型进行实体词识别,得到所述商品搜索语句中的目标实体词;根据所述目标实体词,查找预置实体词编码库,得到所述目标实体词对应的实体词编码;获取所述实体词编码对应的频繁项集,并根据所述频繁项集,确定所述实体词编码对应的关联实体词编码;根据所述实体词编码及所述关联实体词编码,确定对应的商品属性信息,并根据所述商品属性信息查找预置商品数据库,输出商品搜索结果。本发明能快速提取用户搜索语句中的实体词,并精准地输出与用户搜索意图相匹配的强关联商品。

技术领域

本发明涉及大数据领域,尤其涉及一种商品搜索数据处理方法、装置、设备及存储介质。

背景技术

互联网购物是现今社会主流的购物方式之一,用户只需登录到电商网站搜索自己想要购买的商品,就能获得与自己搜索意图相匹配的相关商品,进而挑选出要购买的商品并下单成交。而各电商网站为了获得更多的成交量,需要对商品搜索的方式不断地优化和改进,使呈现出来的商品更符合用户的搜索意图,提高用户体验的同时促成交易。

现有技术中,对于商品搜索数据的处理方式繁多,大多是基于搜索关键词和商品标题的匹配算法,或者基于搜索关键词和商品分类信息的匹配算法,这些搜索数据处理方式可能会因关键词提取不准确导致匹配商品不准确、或因匹配到的商品数据量过大导致用户难以筛选意向商品的问题。另外,现有的对商品搜索数据的处理方法并未涉及到对用户不同购买意向强度的商品数据进行筛选处理,因而商品搜索结果很难符合用户预期。

发明内容

本发明的主要目的在于解决商品搜索数据的处理方式单一导致的商品搜索结果不准确的技术问题。

本发明第一方面提供了一种商品搜索数据处理方法,包括:

获取用户输入的商品搜索语句;

将所述商品搜索语句输入预置实体词提取模型进行实体词识别,得到所述商品搜索语句中的目标实体词;

根据所述目标实体词,查找预置实体词编码库,得到所述目标实体词对应的实体词编码;

获取所述实体词编码对应的频繁项集,并根据所述频繁项集,确定所述实体词编码对应的关联实体词编码;

根据所述实体词编码及所述关联实体词编码,确定对应的商品属性信息,并根据所述商品属性信息查找预置商品数据库,输出商品搜索结果。

可选的,在本发明第一方面的第一种实现方式中,所述实体词提取模型包括双向LSTM层、CRF层及SoftMax层,所述将所述商品搜索语句输入预置实体词提取模型进行实体词识别,得到所述商品搜索语句中的目标实体词包括:

将所述商品搜索语句转化为多个one-hot稀疏向量并映射为稠密向量;

对所述各稠密向量进行随机失活处理,得到多个新的稠密向量;

将所述各新的稠密向量输入所述双向LSTM层进行特征提取,得到隐状态特征序列;

将所述隐状态特征序列输入所述CRF层进行词性标签的转移概率计算,得到标签转移矩阵;

将所述标签转移矩阵输入所述SoftMax层进行归一化处理,得到所述商品搜索语句中各字词对应的实体词概率,并将最高实体词概率对应的字词作为目标实体词。

可选的,在本发明第一方面的第二种实现方式中,在所述获取用户输入的商品搜索语句之前,还包括:

接收新增商品请求,其中,所述请求包括商品属性信息及商品实体词;

根据所述商品属性信息及所述商品实体词,对所述商品实体词进行编码,得到实体词编码并存入实体词编码库中,其中,所述实体词编码包括商品属性码及商品实体词ID。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110198979.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top