[发明专利]基于用户发布内容量化新闻价值的数据处理方法和装置在审

专利信息
申请号: 201811540550.7 申请日: 2018-12-17
公开(公告)号: CN109800349A 公开(公告)日: 2019-05-24
发明(设计)人: 傅湘玲;齐佳音;李晶;闫晨巍 申请(专利权)人: 北京邮电大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/35;G06F17/27
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 陈宙
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户发布 方法和装置 价值量化 社会重要性 量化处理 内容量化 新闻线索 数据处理 海量文本数据 信息抽取模块 价值指数 事件位置 信息要素 生产链 时效性 稀缺性 新事件 度量 构建 获知 抽取 智能 冲突 发布 统计 网络 发现
【权利要求书】:

1.基于用户发布内容量化新闻价值的数据处理方法,其特征在于,包括步骤:

预先构建新闻价值量化模型,从社会重要性、偏差和权变条件三个维度量化用户发布内容的新闻价值;对社会重要性从参与者的重要性、事件位置的重要性和事件的重要性三个指标进行量化处理,对偏差从事件程度冲突和统计稀缺性两个指标进行量化处理,对权变条件从信息及时性和信息完整性两个指标进行量化处理;

从用户发布内容中抽取出与所述新闻价值量化模型中的各个指标对应的信息要素、并转化为可量化处理的数字信息;

将所述数字信息输入所述新闻价值量化模型,计算得到用户发布内容的新闻价值量化值。

2.根据权利要求1所述的基于用户发布内容量化新闻价值的数据处理方法,其特征在于,所述步骤对社会重要性从参与者的重要性、事件位置的重要性和事件的重要性三个指标进行量化处理,包括:

从参与者、事件位置和事件三个维度来设置重要词汇的集合,并对应设置各个重要词汇的重要等级;

检测用户发布内容中出现的重要词汇的数量和重要等级;

计算社会重要性的量化值:

其中,S_word是重要词汇的集合,sig_degree是每个重要词汇的重要等级。

3.根据权利要求1所述的基于用户发布内容量化新闻价值的数据处理方法,其特征在于:

所述步骤对权变条件从信息及时性和信息完整性两个指标进行量化处理,包括从用户发布内容或发布时间中提取事件发生时间来量化计算所述信息及时性、通过用户发布内容中的命名实体数量来量化计算所述信息完整性;所述信息及时性计算式如下:

Timeliness=100-2t/24

Timeliness即信息及时性,t为提取的所述事件发生时间与当前时间的间隔;

所述信息完整性计算式如下:

Completeness of information=nentitytype

Completeness of information即信息完整性,nentity是命名实体的数量,type是命名实体类型的数量;

和/或,所述步骤对偏差从事件程度冲突和统计稀缺性两个指标进行量化处理,包括使用事件后果来量化计算事件冲突程度和统计稀缺性;对于交通事故,包括采用下式计算偏差:

Deviance=Death+(Injury/n)

Deviance表示偏差,Death表示死亡人数,Injury表示受伤人数,n为根据伤害程度预设的数值。

4.根据权利要求1-3任一项所述的基于用户发布内容量化新闻价值的数据处理方法,其特征在于,所述步骤构建新闻价值量化模型,包括构建如下新闻价值量化模型:

Newsworthiness score

=ω1×Social significance+ω2×Deviance+ω3×Timeliness+ω4×Completenessof information

其中,Newsworthiness score为新闻价值量化值,Social significance为社会重要性,Deviance为偏差,Timeliness为信息及时性,Completeness of information为信息完整性,ω14分别代表社会重要性、事件后果、信息及时性和信息完整性对应的权重。

5.根据权利要求4所述的基于用户发布内容量化新闻价值的数据处理方法,其特征在于,所述步骤构建新闻价值量化模型,还包括将权重分别设为ω1=0.381,ω2=0.256,ω3=0.159,ω4=0.204。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811540550.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top