[发明专利]一种舆情监测方法和舆情监测系统在审
申请号: | 202210047264.7 | 申请日: | 2022-01-17 |
公开(公告)号: | CN115017302A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 李响;杨国武;李蒍韦;侯柏成 | 申请(专利权)人: | 黄河水利职业技术学院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 杨浩林 |
地址: | 475004*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 舆情 监测 方法 系统 | ||
本发明公开了一种舆情监测方法和舆情监测系统,所述舆情监测方法包括:S1:获取关键词;S2:对所述关键词进行关键词扩充操作,得到关键词库;S3:对所述关键词库中的敏感词进行提取操作,得到敏感词库;S4:采集所述关键词库和所述敏感词库的最终舆情数据;S5:对所述舆情数据进行预处理操作,得到预处理结果;S6:对所述预处理结果进行舆情分析处理,得到分析结果;S7:根据所述分析结果,得到舆情监测结果。本发明所提供的舆情监测方法和舆情监测系统,能够有效提高舆情数据的全面性以及准确性。
技术领域
本发明涉及舆情监测技术领域,具体涉及一种舆情监测方法和舆情监测系统。
背景技术
进入信息时代,互联网已经成为了当今社会进行信息传递的重要渠道和载体,基于互联网技术而生的社交媒体在社会生活中得到了广泛应用,人们早已将信息搜集的重心放到了网络社交平台上。但在大数据的时代背景下,网络媒体中的数据规模持续增长,数据形式越发多样,信息传播速度不断提高,这些改变为期待能够监控准确,响应迅速的舆情监控工作带来了不小挑战。已有的舆情监控系统存在以下问题:
1.采集数据的来源较少,信息不全面。大多网络舆情监控系统都只针对单一网站进行数据采集并分析,但如今各社交平台,网络媒体百花齐放,不同平台有不同平台的用户特点,各自的舆情数据也就有了不同的价值。多渠道采集舆情数据,才能更全面,准确的反应网络舆情的状况。
2.舆情检索不准确。大数据背景下,网络舆情数据规模庞大,信息繁杂。一些舆情监控系统直接使用用户提供的关键词进行信息采集,然而由于词汇多有近义词,不同时期可能有不同的网络流行词表达,并且词句可能有歧义等问题,直接使用初始关键词进行检索采集到的大多是寻常意义上的信息,无法获取到最全面的舆情数据以及用户关注的敏感舆情。
3.单文本情感分析的方法对反讽,语句歧义等问题解决效果较差。当下的情感分析方法大多是针对文本的情感分析,这类方法往往无法很好的识别反讽语句,因为这类语句抛弃上下文环境和正常语句相差甚微。而在如今的网络环境中,图片例如emoji,表情包等已经成为了人们表达情绪的重要补充,值得引起情感分析领域的关注。
发明内容
本发明的目的在于提供一种舆情监测方法和舆情监测系统,以能够有效提高舆情数据的全面性以及准确性。
本发明解决上述技术问题的技术方案如下:
本发明提供一种舆情监测方法,所述舆情监测方法包括:
S1:获取用户输入的关键词;
S2:对所述关键词进行关键词扩充操作,得到关键词库;
S3:对所述关键词库中的敏感词进行提取操作,得到敏感词库;
S4:采集所述关键词库和所述敏感词库的最终舆情数据;
S5:对所述最终舆情数据进行预处理操作,得到预处理结果;
S6:对所述预处理结果进行舆情分析处理,得到分析结果;
S7:根据所述分析结果,得到舆情监测结果。
可选择地,所述步骤S2包括:
利用所述关键词在相关数据源中进行搜索,得到与所述关键词相匹配的多条数据信息;
根据所有所述数据信息,得到所述关键词库。
可选择地,所述步骤S3包括:
利用分词工具包对所述关键词库中所有数据进行分词操作,得到分词数据库;
将所有所述分词数据信息转换为词向量信息;
根据所述词向量信息,利用BiLSTM模型提取所述分词数据库中的负面词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄河水利职业技术学院,未经黄河水利职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210047264.7/2.html,转载请声明来源钻瓜专利网。