[发明专利]基于用户生成内容的新闻认证预警方法及系统有效
申请号: | 201410414956.6 | 申请日: | 2014-08-21 |
公开(公告)号: | CN104636408B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 曹娟;吴波;谢菲;张勇东;苏宇;李锦涛;吕锐;曹学会 | 申请(专利权)人: | 中国科学院计算技术研究所;新华通讯社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司11006 | 代理人: | 祁建国,梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 生成 内容 新闻 认证 预警 方法 系统 | ||
技术领域
本发明涉及新闻认证领域,尤其涉及基于用户生成内容的新闻认证预警方法及系统。
背景技术
随着互联网技术的深入人心和WEB2.0技术的蓬勃发展,普通用户成为互联网上的内容的主要生产者。UGC(User Generated Content)是用户生成内容的简称,UGC新闻是在社会媒体(例如微博、博客、社交网络等)中用户们自发上传或分享的新闻事件信息。UGC内容由于其具有反应及时、传播快等特点,也成为传统媒体的一个主要信息来源。但是,由于UGC内容的门槛低,任何用户都可以向互联网上传内容,缺乏对UGC内容的有效监管,UGC中存在着大量的虚假新闻,这也给传统的通讯社在发布UGC信息带来困扰。
从国内外研究进展来看,一方面,目前相关的研究主要针对UGC内容(非新闻内容)可信性,或者传统新闻稿件(非UGC)可信性,建立全面而科学的信息可信度评价指标体系,而针对UGC新闻的研究还处于空白阶段;另一方面,这些研究都是从传播学,心理学,社会学的角度出发,通过问卷调查的方式进行理论分析。而在应用领域针对UGC新闻认证的研究才刚刚起步,暂时还没有成熟的解决方案。因此,在政府和社会越来越依赖互联网新闻资源,而网络新闻可信度现状又不理想的背景下,本项目从UGC新闻线索认证的实际需求出发,进行互联网UGC新闻内容认证的关键技术研究,将具有重要的研究价值。
发明内容
为了解决上述问题的不足,本发明提供了基于用户生成内容的新闻认证预警方法及系统。本发明的目的是在输入新闻线索和新闻时间点后实现自动挖掘、判定相关新闻线索的可信度,并且通过可视化的结果展示给用户丰富、直观的认证结果、数据和证据。
为达到上述目的,本发明从互联网UGC新闻线索中提取关键的认证要素,并从用户群体,传播模式和信息内容(多媒体内容、文本内容)等方面对其进行可信度认证的关键技术。最终形成UGC新闻真实性的预警分级,为该新闻是否为真实信息提供决策支持。
本发明提供的一种基于用户生成内容的新闻认证预警系统,包括:
新闻线索语义扩展模块,用于获取新闻线索,并对该新闻线索进行语义扩展,获取参考数据;
参数数据定向采集模块,用于对该参考数据进行定向采集,获取信息内容、传输模式、用户群体、用户群体的行为信息和属性信息;
语义知识提取模块,从该信息内容中提取语义知识;
语义知识对比认证模块,对该语义知识进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索;
用户群体认证模块,分析用户群体的行为信息和属性信息,提取该行为信息和属性信息的可信度认证要素,获取该用户群体的可信度认证结果R(U);
信息内容认证模块,用于将信息内容进行逻辑对比认证,将该信息内容反应的情绪、新闻观点进行分类,获取该信息内容认证结果R(M);
传播模式认证模块,用于挖掘该新闻观点的传播模式,检测具有异常的传播模式,获取该传播模式异常度认证结果R(G);
预警分级模块,用于根据这些认证结果及其相应的权重,对该新闻线索的可信度进行预警分级。
所述基于用户生成内容的新闻认证预警系统,还包括:认证结果展示模块,用于将该用户群体的可信度认证结果R(U)、该信息内容认证结果R(M)、该传播模式异常度认证结果R(G)进行整理和结构化展示。
所述基于用户生成内容的新闻认证预警系统,还包括:
该参考数据包括新闻线索标签、源头微博、以及对应的微博信息链接、作者账号;
该信息内容包括,文本内容和多媒体内容;
该语义知识包含该多媒体和文本语义知识,该多媒体语义知识是指从该多媒体内容中提取高稳定性和区分性的视觉指纹;
该预警分级计算公式为:R={w1R(U)+w2R(G)+w3R(M)},其中w1,w2,w3为权重。
所述基于用户生成内容的新闻认证预警系统,用户群体认证模块还包括:
识别模块,首先在微博平台中识别与该新闻线索相关的用户群体;
特性分析模块,对该用户群体中的核心人物进行深度分析,总结该核心人物的行为信息和属性信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所;新华通讯社,未经中国科学院计算技术研究所;新华通讯社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410414956.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法