[发明专利]舆情分析方法、装置及存储介质在审

专利信息
申请号: 202210621457.9 申请日: 2022-06-02
公开(公告)号: CN114896543A 公开(公告)日: 2022-08-12
发明(设计)人: 李杰;刘晓雷;王长春 申请(专利权)人: 上海华客信息科技有限公司
主分类号: G06F16/958 分类号: G06F16/958;G06F16/955;G06F40/30;G06F16/35;G06F16/38;G06F16/338
代理公司: 上海隆天律师事务所 31282 代理人: 高彦
地址: 200335 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 舆情 分析 方法 装置 存储 介质
【说明书】:

本公开实施例中提供舆情分析方法、装置及存储介质,舆情分析方法包括:获取数据采集参数,所述数据采集参数包括用户输入的关键词;基于数据采集参数构造资源定位信息,并根据资源定位信息形成数据采集请求;通过浏览器向信息交流服务器发送所述数据采集请求,以获得对应所述资源定位信息的网页元素;基于所述网页元素解析得到符合语义情感分析条件的舆情文本数据;根据所述舆情文本数据进行语义情感分析以获得舆情标签并显示。本公开方案实现自动化地根据构造的数据采集参数获取关键词相关的详细全面的舆情信息,以能对获得的舆情文本数据进行语义情感分析并呈现结果,效率高。

技术领域

本公开涉及网络数据分析技术领域,尤其涉及舆情分析方法、装置及存储介质。

背景技术

随着近些年移动互联网技术的全面发展,每天都会有大量的舆情信息产生,过剩的数字信息对人们的生活产生了严重影响。如何合理高效地获取到人们关心的数据并且对这些数据进行精细化分析,成为数字化经济的重要课题。

由于近些年互联网技术的不断进步和相关技术的大量应用,关于舆情数据的网页元素的采集存在着各种各样的效率问题,如需要登录、网页数量限制等,都会对网页页面元素的采集效率产生重大的影响,极大的增加了数据获取的复杂度。

发明消息

鉴于以上相关技术的缺点,本公开的目的在于提供舆情分析方法、装置及存储介质,以解决相关技术中的问题。

本公开第一方面提供一种舆情分析方法,包括:获取数据采集参数,所述数据采集参数包括用户输入的关键词;基于数据采集参数构造资源定位信息,并根据资源定位信息形成数据采集请求;通过浏览器向信息交流服务器发送所述数据采集请求,以获得对应所述资源定位信息的网页元素;基于所述网页元素解析得到符合语义情感分析条件的舆情文本数据;根据所述舆情文本数据进行语义情感分析以获得舆情标签并显示。

在第一方面的实施例中,所述资源定位信息为统一资源定位符,所述统一资源定位符包含关键词的编码信息。

在第一方面的实施例中,所述的舆情分析方法还包括:获取当前网页的第一资源定位信息;基于资源定位信息生成规则,根据所述第一资源定位信息生成用于形成下一数据采集请求的第二资源定位信息。

在第一方面的实施例中,所述网页元素包括:用户发布信息;用户发布信息的评论;评论的追评。

在第一方面的实施例中,所述数据采集参数还包括以下至少一种:数据采集的时间范围;搜索区域;邻近网页之间的时间间隔。

在第一方面的实施例中,所述通过浏览器向信息交流服务器发送包含所述数据采集参数的数据采集请求,包括:通过所述浏览器发送携带历史登录信息的访问请求,以直接登录所述信息交流服务器。

在第一方面的实施例中,所述历史登录信息包括历史登录所述信息交流服务器的记录文本文件。

在第一方面的实施例中,所述基于所述网页元素解析得到符合语义情感分析条件的舆情文本数据,包括:根据预设正则表达式从网页元素解析得到所述舆情文本数据。

在第一方面的实施例中,所述根据所述舆情文本数据进行语义情感分析以获得舆情标签并显示,包括:通过文本语义情感分析模型执行所述语义情感分析;其中,所述文本语义情感分析模型基于屏蔽语言模型构建。

本公开第二方面提供一种舆情分析装置,包括:数据采集参数获取模块,用于获取数据采集参数,所述数据采集参数包括用户输入的关键词;数据采集请求模块,用于基于数据采集参数构造资源定位信息,并根据资源定位信息形成数据采集请求;发送模块,用于通过浏览器向信息交流服务器发送所述数据采集请求,以获得对应所述资源定位信息的网页元素;解析模块,用于基于所述网页元素解析得到符合语义情感分析条件的舆情文本数据;语义情感打标模块,用于根据所述舆情文本数据进行语义情感分析以获得舆情标签并显示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海华客信息科技有限公司,未经上海华客信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210621457.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top