[发明专利]一种基于主题建模的社会群体间影响力量化方法有效
申请号: | 201910500180.2 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110287485B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 马驰;张怡 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/117;G06Q50/00;G06F40/216 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 建模 社会群体 影响力 量化 方法 | ||
本发明公开了一种基于主题建模的社会群体间影响力量化方法,步骤1,对每个社交群体的文本语义提取模型;步骤2,获取每条原始数据C1、...、CN的主题分布概率,选择概率值最大的主题标号作为该原始数据所属主题的编号进行标注,对标注后的原始数据数据进行结构化处理,生成社会群体对应N个数据集;步骤3,计算社会群体Group i的主题topic‑k在t+1时段所受到的其他社会群体的影响。与现有技术相比,本发明1)创新性地将统计与语义分析相结合;2)使用户对群体间意见的相互影响的判断更符合实际。
技术领域
本发明涉及社交媒体舆论分析领域,特别涉及一种社会群体间的影响力量化方法。
背景技术
如今,社交群体用户数量庞大,这些用户在事件发酵过程中产生巨大的流量。探索不同社会群体的观点变化和这些群体间的互相影响对于政府机构、新闻媒体或者大型企业管理者快速了解社会群体间的互相影响并作出舆论控制策略有着重要意义。现有的影响力量化方法大多数直接使用转发量来做影响力的衡量,这种方法忽略了在社交网络中无处不在的‘水军’。因为在真实的传播过程中,受众往往从自己原有的意见、观点和兴趣出发,有选择地接触信息,他们更倾向于接触与自己态度较为一致的信息。因此考虑信息间的语义相似度来量化影响力的方法更具有实际意义。提取文本的内容有聚类和主题建模两种方式,使用聚类算法的提取结果不能反映词汇间以及不同文本间词汇的语义信息,而主题建模方法更适合提取文本的语义信息。对于包含时间信息的时序数据,提取文本的语义内容时多使用引入时间构建的主题建模来实现。
发明内容
本发明旨在提出一种基于主题建模的社会群体间影响力量化方法,将社会群体间的影响力进行量化,使影响力更直观便于分析。
本发明的一种基于主题建模的社会群体间影响力量化方法,该方法包括如下步骤:
步骤1,对每个社交群体的文本语义,使用DTM来提取模型,该模型由预处理后的将社会群体Group1、...、Group N所对应的原始数据C1、...、CN按发布时间排序的文本的值corpus和每个时段的文本数目序列值slice_time组成,经过N次DTM主题提取,得到每个社会群体的主题模型M1、...、MN;
步骤2,获取每条原始数据C1、...、CN的主题分布概率,选择概率值最大的主题标号作为该原始数据所属主题的编号进行标注,对标注后的原始数据数据进行结构化处理,生成N个社会群体对应N个数据集corpus1、...、corpusN;
步骤3,假设对于社会群体Group i的主题topic-k来说,它在t+1时段所受到的其他社会群体的影响如公式(1)所示:
公式中的每个分项如即为Group j对在t+1时刻的Group i的主题topic-k产生的影响力,使用步骤1得到的所求社会群体的主题模型和步骤2得到的结构化数据,来判断社会群体Group j的推特在t时段里与Group i的主题topic-k相符的推特,并在后一个时段的所求社会群体的该主题的数据里计数转发这些推特的数量,最终使用该数量值与后一个时段的所求社会群体的符合该主题的所有推特数量之比作为影响力量化值;的量化公式如公式(2)所示:
其中,s'表示t时段里Group j的推特总数,s表示t+1时段里Group i的主题topic-k的推特总数,用表示t时段里Group j的某一条推特m的文本内容,用模型Mi分析该文本的主题分布概率来判断该文本是否与topic-k有关,如果m的语义符合topic-k,那么的值为1,反之为0;如果符合,随后计算在t+1时段里的Group i的主题topic-k的推特中转发m的数量,使用Rt+1i(m,k)表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910500180.2/2.html,转载请声明来源钻瓜专利网。