[发明专利]一种微博博文情感分析评估推送方法在审

专利信息
申请号: 202011570993.8 申请日: 2020-12-26
公开(公告)号: CN112612971A 公开(公告)日: 2021-04-06
发明(设计)人: 黄秀君;李清秋;王峥 申请(专利权)人: 河海大学
主分类号: G06F16/9536 分类号: G06F16/9536;G06F16/33;G06F16/35;G06Q50/00;G06F40/211;G06F40/216;G06F40/289;G06K9/62;G06N3/04;G06N3/08
代理公司: 南京千语知识产权代理事务所(普通合伙) 32394 代理人: 尚于杰;祁文彦
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 微博博 文情 分析 评估 推送 方法
【说明书】:

发明公开了一种微博博文情感分析评估推送方法,本发明所述方法主要通过爬虫技术获取所需的数据,并存储在数据库中;利用自然语言处理技术和图像识别技术分别对爬取的博文数据中的文本和图像进行处理,再将处理后的数据结果汇总并进行评估,为微博文本中的词汇进行归类,最终结果可视化为各类情感标签并进行实时推送,可以实现对个别敏感博文进行立场检测,识别是否包含抑郁倾向再进行示警,为研究现代青年emo提供可靠方式。

技术领域

本发明属于信息处理技术领域,具体涉及一种微博博文情感分析评估推送方法。

背景技术

随着21世纪互联网的迅速发展,微博作为一类具有其他媒体无法比拟的及时性、活跃性和快速性的社交应用,具有广大的用户量。在重大事件、公民权益、社会救助等各个领域微博都已成为信息传播的重要载体。截至2020年2月底,中国的微博用户数量已从2010年底的6.311万增加到2.05亿。据官方统计,而微博用户平均发布长文本和文字数量分别达到48万条和1.3亿条左右。

人们喜欢在微博上发表意见、表达情感、交流信息等,比如社会热点话题、国内国外新闻事件、热门电影评论等。通过人们每天在微博上发表的意见或心情会产生许多的在线数据文本信息,而这些观点通常包含这大量的情感信息,因此通过分析这些微博文本信息,可以了解人们对该事件的看法和观点或者是当时的情绪状态。因此,对微博博文进行情感分析可以了解网民对现实生活中的一些热点事件的看法、预测未来的发展趋势,使政府可以及时进行控制、引导舆论向着积极正面的方向发展。

发明内容

本发明提出了一种博文情感分析评估推送方法,通过爬虫技术获取所需的数据,并存储在数据库中;利用自然语言处理技术和图像识别技术分别对爬取的博文数据中的文本和图像进行处理,再将处理后的数据结果汇总并进行评估,为微博文本中的词汇进行归类,最终结果可视化为喜、怒、悲、惊、悔五类情感标签并进行实时推送,为研究现代青年emo提供可靠方式。

本发明的技术方案如下:

一种基于自然语言处理和图像识别的博文情感分析评估推送方法,包括如下步骤:

步骤1:使用爬虫技术获取关注人列表和关注人博文;

步骤2:对博文中的图像及文本进行预处理;

步骤3:对博文进行实时分析与检测并标明情感标签;

步骤4:对个别敏感博文判断立场,分辨是否为抑郁信号;

步骤5:基于检测结果进行实时推送。

所述步骤1使用爬虫技术获取关注人列表和关注人博文,具体包括如下步骤:

步骤11:在浏览器中登录微博,然后用浏览器提供的开发者工具查看请求页面的请求头信息,请求头信息中的“Referer”的内容是访问微博的URL,URL中包含的“用户Uid”是当前用户在微博的唯一标识id;请求头信息中的“Cookie”的内容是成功连接微博服务器之后保存在本地的Cookie,利用它可以简单快速地访问新浪微博;首先需复制“Cookie”的内容,然后在Python中定义headers对象,设置Cookie和Connection,最后在每次访问微博页面时,都将headers作为参数添加到Request对象中,得到微博页面。这样就可以在Cookie的有效期内直接访问微博,并提取自己需要的数据。对于爬虫,采用以下采集准则:1)用最少的接口爬取最多的信息;2)尽量避免重复;3)可扩展性强。

步骤12:微博页面在一开始不会把一页的所有微博显示出来,当滚动条滚动到页面底部时,会自动加载另外的博文,所以一个完整的微博页面需要滚动加载2次才能获得全部45条博文。使用selenium模拟浏览器滚动条操作,在Ajax加载后再获取页面数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011570993.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top