[发明专利]一种舆情传播量预测方法及系统在审
申请号: | 202310232892.7 | 申请日: | 2023-03-10 |
公开(公告)号: | CN116167525A | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 孙鹤立;褚旭光;朱琳琳;孙玉柱;张鹏;何亮 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/951;G06F18/25;G06F40/289;G06Q50/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 钱宇婧 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 舆情 传播 预测 方法 系统 | ||
本发明公开了一种舆情传播量预测方法及系统,属于信息处理技术领域。在真实的舆情传播过程中,舆情的传播情况受当前舆情内容影响与舆情传播的网络结构影响。针对内容传播特征,在真实的社交媒体中,情绪传播是舆情传播的底层逻辑,本发明融合传播内容语义特征以及内容隐含的情感属性,以关注传播内容本身的同时,关注传播事件的情绪意义。同时,通过构建传播网络,利用图卷积算法提取网络结构特征以作为当前舆情的网络传播特征。最终通过融合提取到的传播网络特征和传播内容特征,预测舆情传播热度,并实现预测传播量准确率的提升。
技术领域
本发明属于信息处理技术领域,具体涉及一种舆情传播量预测方法及系统。
背景技术
随着近年来智能移动设备和互联网的高速发展,在线的社交媒体已成为当前社会信息传播的主要工具。与报纸和电视等传统媒体不同,社交平台信息发布门槛低,用户可以方便的分享自己的观点和看法,其他用户又可以对这条信息进行评论和转发,这样的互动使得社交平台上的信息扩散比传统媒体更迅速。社交媒体中的舆情传播量是根据传播规律对信息未来的传播规模进行预测,是目前的研究热点问题。预测信息的传播量可以辅助企业对用户进行个性化推荐,增强应用的便捷性,且社交平台提前预估传播规模可以通过内容分发网络提前将可能的热点信息缓存至离用户更近的数据中心,缓解内容访问量增长带来的压力。除此之外,预测信息的传播量可以帮助政府对舆情及时监测和控制,在捕捉到热点信息后可以便于进一步判断信息的真实性,如果是虚假的或者是由某些团体故意煽动传播的,在监测到后可以快速制止。因此,面对社交网络中日常产生的海量内容,如何准确检测话题并预测舆情传播量成为了重要的研究课题。
传统的预测模型多基于特征提取方法。提取事件的多种相关特征如用户特征、内容特征、时序特征和结构特征。用户特征主要包括参与传播的用户粉丝数量、影响力等。时序特征包括发布时间、用户参与时间等。结构特征是对早期传播网络进行建模并分析网络的结构特征。内容特征包括了文本、图片和视频等多种类型。通过对这些特征进行提取后,结合朴素贝叶斯、线性回归等机器学习算法进行预测。这一类方法在人工提取特征后,通过实验验证其有效性,得到了一些对信息流行度预测任务有效的特征。但是人工构造特征时往往依据经验,这就使得一些特征在特定的数据和场景下才能得到较好的效果。更换数据集或者应用场景后,预测结果就会不理想。而且人工提取特征需要大量的时间,这会造成较大的人力和资源消耗。
在真实的舆情传播过程中,舆情的传播受当前舆情内容影响的同时,还受舆情传播的网络结构影响。针对网络传播特征,传统的模型多考虑传播物的转发量、阅读量等一维传播属性,而这种一维的参数并不能准确刻画舆情的传播网链,不能准确把握舆情传播过程中社交网络结构的影响。针对内容传播特征,传统的模型多仅考虑内容的语义信息,未考虑语义隐含的情感属性,而在真实的社交媒体中,情绪传播是舆情传播的底层逻辑,往往是情绪较为激烈的信息或能引起共情情绪的信息更容易传播,因此传统的基于语义的内容传播特征并不能准确表征舆情内容传播特征,因此,需要找到一种能够结合情感特征与语义特征的完整内容传播特征,并将网络传播特征与内容传播特征融合,进而提高事件传播量预测的准确性的算法。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种舆情传播量预测方法及系统,以解决传统的模型,在提取网络传播特征时,多考虑传播物的一维传播属性,不能准确刻画舆情的传播网链,不能准确把握舆情传播过程中社交网络结构的影响以及在提取内容传播特征时,多仅考虑内容的语义信息,未考虑语义隐含的情感属性,不能准确表征舆情内容传播特征,导致传播量预测的准确率较低的技术问题。
为了达到上述目的,本发明采用以下技术方案予以实现:
本发明公开了一种舆情传播量预测方法,包括以下步骤:
S1、对社交媒体数据进行采集、清洗和预处理,得到N个数据集;
S2、基于传播网链,提取步骤S1得到的数据集的传播网络特征;
S3、基于舆情评论,提取步骤S1得到的数据集的传播内容特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310232892.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:进风网罩装置和电气设备
- 下一篇:一种母液循环泵锆合金轴加工方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理