[发明专利]一种社交策展网络上画板(Board)封面的个性化推荐算法有效
申请号: | 201810727069.2 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109062995B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 毋立芳;杨博文;张岱;简萌;刘海英;张恒;李丰 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;H04L12/58;H04L29/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种社交策展网络上画板(Board)封面的个性化推荐算法涉及智能媒体计算和大数据分析技术领域。本发明基于社交策展网站花瓣网,利用了花瓣网中的多模态数据,设计了一种个性化的画板封面推荐算法,在对采集进行多模态表示后,通过聚类算法将采集向量进行无监督聚类,并选出最靠近模型聚类中心的采集作为画板的新封面。本发明的提出,填补了当前社交策展网络中的功能空缺。 | ||
搜索关键词: | 一种 社交 网络 画板 board 封面 个性化 推荐 算法 | ||
【主权项】:
1.一种社交策展网络上画板(Board)封面的个性化推荐算法,其特征在于,包括如下步骤:一、采集(Pin)的多模态联合表示社交策展网络中,采集与画板存在明显的上下包含关系;基于这种结构,先对构成画板的采集进行了多模态联合表示,再用画板中全部采集的多模态表示,构建画板模型,具体包括以下步骤:1)、文本表示将词向量的均值池化作为文本表示;对于文本T,其最终表示为
其中MT为文本中词数,
为词Wordi的向量表示;2)、图像表示选取CaffeNet作为图像表示学习的基础模型,并且替换了CaffeNet的损失函数;调整后的损失函数为:
其中NC为样本集合,
为分类频数
相应的sigmoid输出;3)、多模态融合多模态DBM的结构为在两个两层的DBM顶部添加一个共享的隐藏层,除了两个可见层,全部隐藏层均由二值单元构成;每个DBM视为由两个RBM层叠相连而成;RBM是一种无向二部图模型,也就是说,可见层与隐藏层的层内无连接、层间双向全连接;多模态DBM的联合分布为
其中θ为全部模型参数,VI、HI1、HI2分别为图像通路的可见层、第一隐藏层、第二隐藏层,VT、HT1、HT2分别为文本通路的可见层、第一隐藏层、第二隐藏层,H3为顶部隐藏层;二、采集多模态表示聚类在得到采集的多模态表示后,使用高斯混合模型的最大期望EM聚类算法对采集向量进行无监督聚类;将采集分成几个主题相近的簇后,再从中选出推荐候选;EM聚类算法流程包含以下步骤:(1)选择簇的数量;封面展示位簇的数量设置为封面展示位的个数;随后,随机初始化每个簇的高斯分布参数;(2)给定每个簇的高斯分布,计算每个数据点属于每个簇的概率;(3)基于高斯分布概率计算高斯分布参数,使得数据点的概率最大化;(4)重复步骤(2)(3)直到迭代收敛,每个采集的概率不再发生变化;三、画板封面推荐在得到画板的多模态建模后,封面推荐算法将计算画板中的所有采集表示与全部采集表示构成的中心点的距离,其计算公式如下
其中Vcen为前一步中得到的画板的聚类中心向量,Vp为采集的多模态向量表示,n为多模态表示向量的维度,i代表向量第i维的取值;求出画板中每一个采集与画板中心的距离后,将距离画板模型中心最近的几个采集的图片作为推荐封面,并在用户设置封面时进行推荐或定期为画板更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810727069.2/,转载请声明来源钻瓜专利网。
- 上一篇:推荐方法、装置、计算机设备和存储介质
- 下一篇:一种云端文件的管理方法及系统