[发明专利]社会网中基于主题兴趣的影响最大化方法有效
申请号: | 201810150517.7 | 申请日: | 2018-02-13 |
公开(公告)号: | CN108197332B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 刘勇;郭龙江;王楠;李金宝 | 申请(专利权)人: | 江苏派智信息科技有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 北京哌智科创知识产权代理事务所(普通合伙) 11745 | 代理人: | 曾倩莹 |
地址: | 212001 江苏省镇江市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 社会网中基于主题兴趣的影响最大化方法,本发明涉及主题兴趣的影响最大化方法。本发明的目的是为了解决现有IC模型没有考虑传播项的特征,假定对所有传播项目的影响概率都是相同的;以及现有TIC模型没有考虑到用户的兴趣分布,不能准确地描述信息传播规律,导致信息传播预测准确率低的问题。本发明过程为:步骤一、建立基于主题兴趣的传播模型TI‑IC;步骤二、利用EM算法学习TI‑IC模型的参数和新传播项的主题分布向量;步骤三、基于步骤二提出针对TI‑IC模型的影响最大化算法。本发明用于社交网的影响最大化问题领域。 | ||
搜索关键词: | 社会 基于 主题 兴趣 影响 最大化 方法 | ||
【主权项】:
1.社会网中基于主题兴趣的影响最大化方法,其特征在于:所述方法具体过程为:步骤一、建立基于主题兴趣的传播模型TI‑IC;给定一个社会网有向图G=(V,E),一组用户的历史动作日志D(u,i,t),对于每个主题z∈[1,Z],每个传播项i都有一个主题分量每个用户结点u都有一个兴趣分量因此每个传播项i存在主题分布向量每个用户结点u存在不同主题上的兴趣分布向量i∈[1,I];其中V为用户集合,E为关系集合;Z为主题总个数,取值为正整数;I为传播项总个数,取值为正整数;D中u属于G中的用户集合V;每个结点仅有一次机会由不活跃状态变为活跃状态,并且该过程不可逆;S表示种集,即初始的活跃用户集合,在t=0时刻,S中的结点在传播项i上活跃;在t≥1时刻,如果用户结点u的任何邻居结点w在时刻t‑1变为活跃状态,则w都有一次机会去激活邻居用户结点u,激活的概率为当用户结点u的邻居结点活跃的条件下,用户结点u被激活的概率如下所示:其中,表示在传播项i的传播过程中,在用户结点u之前已经活跃的邻居结点集合,即Δ为时延阈值;N取值为正整数;ti(w)为结点w在传播项i上活跃的时刻,ti(u)为用户结点u在传播项i上活跃的时刻;ti(u)=∞,代表每个用户结点u不会接受传播项i;令表示传播项i在传播过程中,一定不会影响u的邻居集合;当点用户结点u的任何邻居结点w在传播项i上一定活跃,用户结点u在传播项i上活跃或不活跃;所述TI‑IC为主题‑兴趣的传播模型;步骤二、利用EM算法学习TI‑IC模型的参数和新传播项的主题分布向量;EM算法的输入是:社会网有向图G=(V,E),用户历史动作日志D(u,i,t);假设TI‑IC模型的每个传播项的传播轨迹都是独立的,则给定TI‑IC传播模型参数Θ的对数似然函数,表示为:其中,L(Θ;Di)表示传播项i的传播轨迹的似然函数;传播项i的传播轨迹Di在第z个主题分量上的似然函数定义为:其中,表示传播项i的传播过程中,主题z使结点u被激活的概率,表示传播项i的传播过程中,主题z没有影响结点u的概率:φ为空集;利用EM算法学习TI‑IC模型的参数,得到EM学习算法的输出,即TI‑IC传播模型参数Θ,Θ包括和当新的传播项i出现时,求解新传播项i的主题分布向量步骤三、基于步骤二提出针对TI‑IC模型的影响最大化算法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏派智信息科技有限公司,未经江苏派智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810150517.7/,转载请声明来源钻瓜专利网。
- 上一篇:用户兴趣的探索方法和装置
- 下一篇:境外知识产权代理人推荐装置及其推荐方法