[发明专利]一种基于主题模型的商品推荐方法及系统在审
申请号: | 201710062769.X | 申请日: | 2017-01-25 |
公开(公告)号: | CN106897914A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 黄琦;王涌;徐旭昶 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/27 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 刘静,邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 模型 商品 推荐 方法 系统 | ||
1.一种基于主题模型的商品推荐方法,其特征在于,该方法包括以下步骤:
(1)收集原始数据:定时更新电商词库;整理各大电商商品类目并映射到自有类目体系;采集电商商品入库。
(2)文本预处理:遍历商品库,对商品的文本信息分词过滤,做成词袋。
(3)训练主题模型:获取类目及关联类目中的全部商品词袋,通过LDA机器学习库训练得到“主题-词”矩阵。
(4)处理商品主题分布:根据“主题-词”矩阵,遍历类目及关联类目下的全部商品词袋,得到商品的多维主题分布:(T1,T2,T3,...TV,),主题特征向量Tv=(w1,w2,w3,...,wK),且v是商品序号,V是类目及关联类目下的商品总数,wi是该商品文本信息在第i个主题下的权值,i是主题序号,K是主题个数。对商品的多维主题分布做降维处理:商品的主题向量Tv仅保留权值从大到小前n的主题,n大于等于1且小于主题个数K,实现主题向量的降维,商品投影在n维空间。设定降维次数N,得到N个商品主题分布。
(5)根据文本相关性,获取商品的文本近似商品。
(6)根据主题相关性,获取商品的相关商品,具体包括以下子步骤:
(6.1)找到输入商品在N个商品主题分布中的位置,在第i个商品主题分布中,选择xi个商品主题向量,x1,x2,...,xN依次增大、依次减少或根据线上点击情况确定,取出x1,x2,...,xN个商品。
(6.2)计算原始商品主题向量的余弦相似度:根据商品的主题特征向量Tv=(w1,w2,w3,...,wK)和商品的多维主题分布内所有向量Tu'、进行余弦相似度计算:取得相似度从大到小前Q个商品作为相关商品。
(7)基于逻辑回归的点击率预估策略,确定多种来源的推荐商品比例,实现商品的最优推荐效果。
2.根据权利要求1所述的一种基于主题模型的商品推荐方法,其特征在于,所述步骤5根据文本相关性,获取商品的文本近似商品具体为:使用VSM空间计算任意商品间的余弦相似度,词向量是商品文本词袋,权值是对应的TF-IDF值。
3.一种基于主题模型的商品推荐系统,其特征在于,包括采集模块、预处理模块、模型训练模块、主题相关性计算模块、文本相似性计算模块和推荐模块:
采集模块:定时更新电商词库;整理各大电商商品类目并映射到自有类目体系;采集电商商品入库。
预处理模块:遍历商品库,对商品的文本信息分词过滤,做成词袋。
模型训练模块:获取类目及关联类目中的全部商品词袋,通过LDA机器学习库训练得到“主题-词”矩阵。根据“主题-词”矩阵,遍历类目及关联类目下的全部商品词袋,得到商品的多维主题分布:(T1,T2,T3,...TV,),其中主题特征向量Tv=(w1,w2,w3,...,wK),且v是商品序号,V是类目及关联类目下的商品总数,wi是该商品文本信息在第i个主题下的权值,i是主题序号,K是主题个数。对商品的多维主题分布做降维处理:商品的主题向量Tv仅保留权值从大到小前n的主题,n大于等于1且小于主题个数K,实现主题向量的降维,商品投影在n维空间。设定降维次数N,得到N个商品主题分布。
文本相似性计算模块:根据文本相关性,获取商品的文本近似商品。
主题相关性计算模块:根据主题相关性,获取商品的相关商品,具体为:找到输入商品在N个商品主题分布中的位置,在第i个商品主题分布中,选择xi个商品主题向量,x1,x2,...,xN依次增大、依次减少或根据线上点击情况确定,取出x1,x2,...,xN个商品。计算原始商品主题向量的余弦相似度:根据商品的主题特征向量Tv=(w1,w2,w3,...,wK)和商品的多维主题分布内所有向量T′u、进行余弦相似度计算:取得相似度从大到小前Q个商品作为相关商品。
推荐模块:基于逻辑回归的点击率预估策略,确定多种来源的推荐商品比例,实现商品的最优推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710062769.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精确的注塑机选型方法
- 下一篇:一种基于化工行业的B2P电子商务系统