[发明专利]一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法有效
申请号: | 201710019177.X | 申请日: | 2017-01-11 |
公开(公告)号: | CN106780073B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 邓晓衡;曹德娟;潘琰;沈海澜;桂劲松 | 申请(专利权)人: | 中南大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 用户 行为 情感 社会 网络 影响力 最大化 初始 节点 选取 方法 | ||
本发明公开了一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法,使用带有分类标签的评价数据集,构建情感单词训练模型扩展已有的情感词典,分别对社会网络节点进行行为倾向分析和情感倾向分析,作为节点影响力的评判依据,构建综合考虑用户行为和情感的影响力传播模型BSIS,并结合贪心算法求解最大影响力边际收益节点加入到初始节点集合中。本发明综合考虑用户行为倾向和情感倾向,更加有效、准确、真实地挖掘影响力最大化初始节点。
技术领域
本发明属于计算机技术领域,涉及一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法。
背景技术
随着社会网络快速发展,越来越多人通过微博、朋友圈、Facebook、Twitter等社会网络表达自己对其他人、产品、社会事件等的个人见解与看法,与他人分享交流,将自己的工作、生活、情感展示到社会网络中。在社会网络中,用户之间的交流互动的信息展示了用户之间的情感倾向,通常用户之间的情感直接关系到用户之间的影响因子。根据社会网络中用户的情感影响关系,寻找影响力最大的用户群体,使得信息以最小的代价得到病毒式传播,影响力以“口碑效应”的方式扩散。因此对社会网络用户进行情感分析对于影响力最大化研究具有重要意义。
许多基于IC模型(独立级联模型)和LT模型(线性阈值模型)的改进算法和模型被提出寻找影响力最大化初始节点。在影响力传播时,社会网络中用户情感分析和基于时间延迟的用户行为倾向很少被考虑。
因此,有必要提供一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法。
发明内容
本发明所解决的技术问题是,针对现有技术的不足,提出一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法,基于社会网络用户行为倾向和情感倾向,求解最大边际收益节点作为影响力最大化初始节点,结果更加准确和可靠。
本发明的技术方案为:
一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法,包括以下步骤:
步骤1:使用带有分类标签的评价数据集,构建情感单词训练模型,在已有的情感词典的基础上得到适用于网络评论信息情感分析的附有情感权重的情感单词词表扩展得到新的情感词典;
由于社会网络的评价信息都是无标签的,因此采用电商网络中商品评价信息,根据评价星级对评价信息进行情感分类,5星级为正面评价,1星为负面评价;在本文中,利用爬虫爬取京东商品评价信息,提取商品评价正负样本,且保持正负样本数量均衡。评价信息情感词表构建模型步骤如下:
步骤1.1采用ANSJ将商品评价文本进行中文分词,得到标有单词词性的分词结果,统计形容词分词分别在正向评价样本和负向评价样本中出现的次数;
步骤1.2统计正向评价样本和负向评价样本数量总和N,设置分词次数阈值r,最大情感权重max;
步骤1.3对于形容词分词word,统计其在正向评价样本中出现次数NP和负向评价样本中出现的次数NN,若执行步骤1.4、1.5、1.6;
步骤1.4计算分词word的正向概率PP:
其中PP∈(0,1);
步骤1.5根据分词word的正向概率计算其情感权重w1和w2:
其中PP∈(0,1),则w1∈(-1,1);
其中w2∈(-1,1);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710019177.X/2.html,转载请声明来源钻瓜专利网。