[发明专利]信息处理方法和装置在审
申请号: | 201910731000.1 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110609969A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 龚黎明;蒋增辉;林川;易灿 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 11315 北京国昊天诚知识产权代理有限公司 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 风险事件 网络发布 标识符 发布 度量 方法和装置 数据分析 网络舆情 信息处理 传播 分析 | ||
本公开提供了一种网络舆情数据分析方法和装置。具体而言,本公开提供了一种信息处理方法,包括:获取网络发布文本;分析所述网络发布文本以确定所述文本的发布者标识符、以及与所述文本相关的风险事件类型;根据所述发布者标识符来确定所述发布者的影响力度量;获取与所述风险事件类型相关的历史舆情数目;根据所述发布者的影响力度量以及所述历史舆情数目来确定传播风险值;根据所述风险事件类型来确定事件风险值;以及根据所述传播风险值和所述事件风险值来确定所述网络发布文本的风险等级。
技术领域
本申请一般涉及互联网领域,尤其涉及网络舆情数据的分析和处理。
背景技术
随着互联网的快速发展,用户在各种网络信息平台上发表对一些事件的看法和意见,某些媒体和网站公开发布一些带有倾向性的传播言论,这些内容经过网络的发酵造成了网络舆情,对企业和个人造成了深远的影响。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。
对网络舆情内容的监控从互联网上众多的信息中将关注的事件提取出来,对该事件所代表的舆情的发展变化趋势进行分析预测,进而可以提前采取有效的措施,避免负面社会效应的产生。
发明内容
为解决上述技术问题,本公开提供了一种信息处理方法,包括:
获取网络发布文本;
分析所述网络发布文本以确定所述文本的发布者标识符、以及与所述文本相关的风险事件类型;
根据所述发布者标识符来确定所述发布者的影响力度量;
获取与所述风险事件类型相关的历史舆情数目;
根据所述发布者的影响力度量以及所述历史舆情数目来确定传播风险值;
根据所述风险事件类型来确定事件风险值;以及
根据所述传播风险值和所述事件风险值来确定所述网络发布文本的风险等级。
可任选地,所述确定传播风险值包括:
将所述发布者的影响力度量和所述历史舆情数目进行加权求和以确定所述传播风险值。
可任选地,该方法进一步包括,
根据所述发布者的一个或多个发布者特征来确定所述发布者的影响力度量。
可任选地,所述影响力度量是通过将所述一个或多个发布者特征输入影响力模型来确定的,并且所述影响力模型使用多个发布者的发布者特征和所述多个发布者的历史网络发布文本的风险等级来训练。
可任选地,所述一个或多个发布者特征包括所述发布者的职业、地域、年龄段、以及收入中的一者或多者。
可任选地,所述确定所述网络发布文本的风险等级包括:
将所述传播风险值和所述事件风险值进行加权求和以确定所述风险等级。
可任选地,该方法进一步包括:
从与所述风险事件类型相关的计数器获取与所述事件类型相关的所述历史舆情数目;以及
将与所述风险事件类型相关的计数器的值递增。
可任选地,该方法进一步包括,显示所述发布者的一个或多个发布者特征、所述风险事件类型、所述历史舆情数目、所述传播风险值、所述事件风险值、以及与所述网络发布文本相关的信息中的一者或多者。
可任选地,所述事件风险值是根据与所述风险事件类型相关的多个网络发布文本的风险等级来确定的。
可任选地,所述事件风险值是与所述风险事件类型相关的所述多个网络发布文本的风险等级的加权求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910731000.1/2.html,转载请声明来源钻瓜专利网。