[发明专利]一种近似物品推荐的控制方法及装置有效
申请号: | 202011541921.0 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112256979B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 沈振雷;刘凡平 | 申请(专利权)人: | 上海二三四五网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 曾耀先 |
地址: | 200137 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 近似 物品 推荐 控制 方法 装置 | ||
1.一种近似物品推荐的控制方法,其特征在于,包括如下步骤:
a.将所有待推荐物品的特征信息作为输入在BERT模型中进行预测以确定一个或多个待推荐物品的embedding特征向量,所述待推荐物品至少包括第一物品以及第二物品;
b.将一个或多个待推荐物品的embedding特征向量存储在向量检索数据库中;
c.基于用户访问信息所确定的第一物品在向量检索数据库中匹配,确定所述第一物品的embedding特征向量,所述用户访问信息至少包括用户当前访问信息和/或用户历史访问信息;
d.基于最邻近查找算法确定一个或多个与所述第一物品的embedding特征向量相似的第二物品,其中,所述BERT模型通过如下步骤建立:
a1:计算所有待推荐物品中任意两个物品之间的相似度;
a2:将大于第一阈值的一个或多个物品对以及特征信息作为正样本,将小于第二阈值的一个或多个物品对及其特征信息作为负样本,将正样本以及负样本按照相同比例数量对BERT模型进行训练,其中,所述物品对包含2个物品,其中,
在所述步骤a1中,通过如下公式实现所有待推荐物品中任意两个物品之间的相似度的计算:
,其中,A表示喜欢物品a的用户集合,B表示喜欢物品b的用户集合,f(x) 表示集合元素个数,a、b为所有待推荐物品中任意两个物品。
2.根据权利要求1所述的控制方法,其特征在于,在所述步骤c之前,还包括:
i:将所述用户历史访问信息进行缓存。
3.根据权利要求1所述的控制方法,其特征在于,所述第一阈值的取值范围为0.05~1。
4.根据权利要求2所述的控制方法,其特征在于,所述第二阈值的取值范围为0~0.0015。
5.根据权利要求2所述的控制方法,其特征在于,将大于第一阈值且大于第三阈值的一个或多个物品对以及作为正样本,其中,所述第三阈值为3,所述物品对包含2个物品。
6.根据权利要求1或4或5所述的控制方法,其特征在于,在所述步骤c之前,还包括:
ii:将一个或多个更新物品的特征信息作为输入在BERT模型中进行预测以确定一个或多个更新物品的embedding特征向量;
iii: 将一个或多个更新物品的embedding特征向量存储在向量检索数据库中。
7.根据权利要求1所述的控制方法,其特征在于,在所述步骤d中,所述最邻近查找算法为如下方式中的任一种:
余弦相似度算法;
向量内积算法;或
欧式距离算法。
8.根据权利要求7所述的控制方法,其特征在于,当所述最邻近查找算法为余弦相似度算法时,将与所述第一物品的embedding特征向量相似度小于第四阈值的一个或多个物品作为不相关物品进行去除。
9.根据权利要求8所述的控制方法,其特征在于,所述第四阈值的取值范围为0~0.6。
10.根据权利要求8或9所述的控制方法,其特征在于,将与所述第一物品的embedding特征向量相似度大于第五阈值的一个或多个物品的embedding特征向量作为相同物品进行去除。
11.根据权利要求10所述的控制方法,其特征在于,所述第五阈值的取值范围为0.997~1。
12.根据权利要求8或9或11所述的控制方法,其特征在于,将一个或多个所述第二物品按照相似度从大到小的顺序进行排序后展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海二三四五网络科技有限公司,未经上海二三四五网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011541921.0/1.html,转载请声明来源钻瓜专利网。