[发明专利]商品搜索数据处理方法、装置、设备及存储介质有效
申请号: | 202110198979.8 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112818088B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 谷坤;蒋贝贝 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295;G06F40/44;G06N3/0442;G06N3/084;G06Q30/0601 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 搜索 数据处理 方法 装置 设备 存储 介质 | ||
1.一种商品搜索数据处理方法,其特征在于,所述商品搜索数据处理方法包括:
获取用户输入的商品搜索语句;
将所述商品搜索语句输入预置实体词提取模型进行实体词识别,得到所述商品搜索语句中的目标实体词;
根据所述目标实体词,查找预置实体词编码库,得到所述目标实体词对应的实体词编码;
获取所述实体词编码对应的频繁项集,并根据所述频繁项集,确定所述实体词编码对应的关联实体词编码;
根据所述实体词编码及所述关联实体词编码,确定对应的商品属性信息,并根据所述商品属性信息查找预置商品数据库,输出商品搜索结果;
所述实体词提取模型包括双向LSTM层、CRF层及SoftMax层,所述将所述商品搜索语句输入预置实体词提取模型进行实体词识别,得到所述商品搜索语句中的目标实体词包括:
将所述商品搜索语句转化为多个one-hot稀疏向量并映射为稠密向量;
对所述各稠密向量进行随机失活处理,得到多个新的稠密向量;
将所述各新的稠密向量输入所述双向LSTM层进行特征提取,得到隐状态特征序列;
将所述隐状态特征序列输入所述CRF层进行词性标签的转移概率计算,得到标签转移矩阵;
将所述标签转移矩阵输入所述SoftMax层进行归一化处理,得到所述商品搜索语句中各字词对应的实体词概率,并将最高实体词概率对应的字词作为目标实体词;
所述将所述商品搜索语句转化为多个one-hot稀疏向量并映射为稠密向量,包括:
利用one-hot稀疏向量来表示用户输入的商品搜索语句中的每个字词,再根据Embedding算法,把每个one-hot稀疏向量映射为稠密向量。
2.根据权利要求1所述的商品搜索数据处理方法,其特征在于,在所述获取用户输入的商品搜索语句之前,还包括:
接收新增商品请求,其中,所述请求包括商品属性信息及商品实体词;
根据所述商品属性信息及所述商品实体词,对所述商品实体词进行编码,得到实体词编码并存入实体词编码库中,其中,所述实体词编码包括商品属性码及商品实体词ID。
3.根据权利要求2所述的商品搜索数据处理方法,其特征在于,在所述获取用户输入的商品搜索语句之前,还包括:
获取预置时长内各用户意向购买的第一商品列表以及已购买的第二商品列表;
分别提取所述第一商品列表、所述第二商品列表中各商品对应的实体词,得到多个实体词列表;
查找所述实体词编码库,得到所述各实体词列表对应的词编码列表;
计算所述各词编码列表中各词编码之间的支持度,得到所述各实体词对应的频繁项集。
4.根据权利要求3所述的商品搜索数据处理方法,其特征在于,所述计算所述词编码列表中各词编码之间的支持度,得到所述各实体词对应的频繁项集包括:
将所述第一商品列表对应的词编码列表中的各词编码进行组合,得到多个第一项集,以及将所述第二商品列表对应的词编码列表中的各词编码进行组合,得到多个第二项集;
分别计算所述各第一项集的第一支持度以及所述各第二项集的第二支持度;
根据所述各第一支持度,得到多个第一频繁项集,以及根据所述各第二支持度,得到多个第二频繁项集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110198979.8/1.html,转载请声明来源钻瓜专利网。