[发明专利]网络舆情分析方法、装置、系统、设备及可读存储介质在审
申请号: | 202010548376.1 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111680226A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 侯星良;范渊 | 申请(专利权)人: | 杭州安恒信息技术股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q10/06;G06Q50/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 舆情 分析 方法 装置 系统 设备 可读 存储 介质 | ||
1.一种网络舆情分析方法,其特征在于,包括:
实时获取不同传播渠道公布的网络信息;
提取所述网络信息中的热点信息;
利用贝叶斯算法分析所述热点信息的正负向趋势;
将所述正负向趋势添加至所述热点信息的预测参数,并根据所述预测参数预测所述热点信息的舆情风险。
2.根据权利要求1所述的网络舆情分析方法,其特征在于,所述提取所述网络信息中的热点信息,包括:
去除所述网络信息的网页标签,获得文本信息;
对所述文本信息进行分词,获得词汇信息;
利用热点词汇模型去除所述词汇信息中的非热点词汇,以保留所述热点信息。
3.根据权利要求2所述的网络舆情分析方法,其特征在于,所述利用热点词汇模型去除所述词汇信息中的无关词汇,以保留所述热点信息,包括:
利用所述热点词汇模型去除所述词汇信息中的非热点词汇,获得热点词汇;
按照所述热点词汇的出现频率从所述热点词汇中选择所述热点信息。
4.根据权利要求1所述的网络舆情分析方法,其特征在于,所述利用贝叶斯算法分析所述热点信息的正负向趋势,包括:
确定与所述热点信息关联的目标文本;
利用所述贝叶斯算法分析所述目标文本,获得所述正负向趋势。
5.根据权利要求1所述的网络舆情分析方法,其特征在于,所述根据所述预测参数预测所述热点信息的舆情风险,包括:
利用线性回归算法分析所述预测参数,获得所述舆情风险;所述预测参数包括:所述正负向趋势,所述热点信息,与所述热点信息关联的目标文本,所述目标文本的创建时间、所属的传播渠道和浏览量。
6.根据权利要求1至5任一项所述的网络舆情分析方法,其特征在于,所述根据所述预测参数预测所述热点信息的舆情风险之后,还包括:
将所述热点信息、所述正负向趋势和所述舆情风险存储至KV数据库。
7.一种网络舆情分析装置,其特征在于,包括:
获取模块,用于实时获取不同传播渠道公布的网络信息;
提取模块,用于提取所述网络信息中的热点信息;
分析模块,用于利用贝叶斯算法分析所述热点信息的正负向趋势;
预测模块,用于将所述正负向趋势添加至所述热点信息的预测参数,并根据所述预测参数预测所述热点信息的舆情风险。
8.一种网络舆情分析系统,其特征在于,包括:爬虫端、消息中间件和Flink计算平台,其中:
所述爬虫端,用于爬取不同传播渠道公布的网络信息;
所述消息中间件,用于将所述网络信息从所述爬虫端传输至所述Flink计算平台;
所述Flink计算平台,用于实时获取所述网络信息;提取所述网络信息中的热点信息;利用贝叶斯算法分析所述热点信息的正负向趋势;将所述正负向趋势添加至所述热点信息的预测参数,并根据所述预测参数预测所述热点信息的舆情风险。
9.一种网络舆情分析设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至6任一项所述的网络舆情分析方法。
10.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的网络舆情分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州安恒信息技术股份有限公司,未经杭州安恒信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010548376.1/1.html,转载请声明来源钻瓜专利网。