[发明专利]一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法有效
申请号: | 201710019177.X | 申请日: | 2017-01-11 |
公开(公告)号: | CN106780073B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 邓晓衡;曹德娟;潘琰;沈海澜;桂劲松 | 申请(专利权)人: | 中南大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法,使用带有分类标签的评价数据集,构建情感单词训练模型扩展已有的情感词典,分别对社会网络节点进行行为倾向分析和情感倾向分析,作为节点影响力的评判依据,构建综合考虑用户行为和情感的影响力传播模型BSIS,并结合贪心算法求解最大影响力边际收益节点加入到初始节点集合中。本发明综合考虑用户行为倾向和情感倾向,更加有效、准确、真实地挖掘影响力最大化初始节点。 | ||
搜索关键词: | 一种 考虑 用户 行为 情感 社会 网络 影响力 最大化 初始 节点 选取 方法 | ||
【主权项】:
一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法,其特征在于,包括以下步骤:步骤1:使用带有分类标签的评价数据集,构建情感单词训练模型,在已有的情感词典的基础上得到适用于网络评论信息情感分析的附有情感权重的情感单词词表扩展得到新的情感词典;由于社会网络的评价信息都是无标签的,因此采用电商网络中商品评价信息,根据评价星级对评价信息进行情感分类,5星级为正面评价,1星为负面评价;在本文中,利用爬虫爬取京东商品评价信息,提取商品评价正负样本,且保持正负样本数量均衡;评价信息情感词表构建模型步骤如下:步骤1.1采用ANSJ将商品评价文本进行中文分词,得到标有单词词性的分词结果,统计词性为形容词的分词分别在正向评价样本和负向评价样本中出现的次数;步骤1.2统计正向评价样本和负向评价样本数量总和N,设置分词次数阈值r,最大情感权重max;步骤1.3对于词性为形容词的分词word,统计其在正向评价样本中出现次数NP和负向评价样本中出现的次数NN,若执行步骤1.4、1.5、1.6;步骤1.4计算单词word的正向概率PP:其中PP∈(0,1);步骤1.5根据分词word的正向概率计算其情感权重w1和w2:其中PP∈(0,1),则w1∈(‑1,1);其中w2∈(‑1,1);步骤1.6给定形容词分词word,其综合情感权重为w:步骤2:对社会网络数据集进行数据预处理与数据抽取,提取用户行为记录,计算考虑用户行为时间延迟的用户行为影响力;在社会网络中,若用户节点u和v为相邻节点,且v对u发布的消息经过一系列时间延迟产生一系列行为,其中行为包括点赞、评论和转发,则考虑用户行为时间延迟的用户行为影响力B_Inf(u,v)为:其中,λ∈(0,1),M(u)表示u执行过行为的消息集合,M(v)表示用户v执行过行为的消息集合,|M(u)|代表u执行过行为的消息条数,|M(u)∩M(v)|表示v对u发布的消息执行行为的条数,t表示v对与u发布的消息执行行为的平均时间延迟,T表示v对与其所有邻居节点发布的消息执行行为的平均时间延迟;步骤3:根据已经扩展的情感词典,对社会网络用户之间评论信息进行情感分析,得到基于用户情感倾向的用户情感影响力;给定两个相邻用户节点u和v,若u发布一则消息,v对其进行评价,对其中一条评价内容commentj进行分词得到一系列分词集合{word1,word2,...,wordn},去查找每个分词在情感词典中相应的分词情感权重{w1,w2,...,wn},若wi=0,则此条评价内容的情感分值:值得说明的是,在评论信息中往往会出现具有转折意义的词语,例如中文中的“不是,不”和英文中“not”等副词,这类词与其他情感分词结合会使得它修饰的情感分词表达的意思反向;因此,考虑到转折语义的修饰性副词,我们分析这类词语的上下文,将与其相邻的情感分词提取出来得到转折分词集合{reverse_w1,reverse_w2,...,reverse_wm},去查找他们分别在情感词典中的情感权重{r_w1,r_w2,...,r_wm},对commentj的情感分值进行修正得到修正的情感分值:因此,若评价内容commentj中包含的正向情感词越多,分词情感权重累加值越高且为正,代表v对u的正向情感越浓,由此而知可以推导u对v的影响力越大;若评价内容commentj中包含的负向情感词越多,分词情感权重累加值负的越多且为负,代表v对u负向情感越浓,由此推导u对v的影响力越大;因此,给定两个相邻用户节点u和v,v对u的一则评论commentj,基于commentj的情感分值推导u对v的单个情感影响力:其中ο∈(0,1);因此给定两个相邻用户节点u和v和多条v对u的评论信息{comment1,comment2,...,commentn},根据每条评论计算得到的节点情感影响力,取平均值得出u对v的情感影响力:步骤4:综合考虑基于用户行为倾向的情感倾向的影响力,得到用户总影响力TotalInfu,v:TotalInfu,v=β·β_Infu,v+(1‑β)·SentiInfu,v;步骤5:根据步骤4计算得到的总影响力和总影响力的传播路径,全面考虑社会网络节点的拓扑关系,因此u对v的传播影响力总和为φu,v(v):其中I(v)表示网络拓扑结构中对v存在行为和情感影响力的节点集合;步骤6:计算节点u总影响力边际收益为σMarginal_Revenue(u):其中,S代表初始节点集合,A代表社会网络中所有用户节点的集合;计算社会网络中节点边际收益并按大小排序,选取边际收益最大的前nk个节点依次插入到队列Q,弹出Q中边际收益最大节点插入到S中;步骤7:统计S中节点个数,若|S|<k,按照步骤6重新计算队列Q中所有节点边际收益并更新排序,弹出Q中边际收益最大节点插入到S中,若|S|=k,则S为最终的初始节点集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710019177.X/,转载请声明来源钻瓜专利网。