[发明专利]一种基于观点挖掘的社交媒体信息可信度评估方法及装置有效

申请号：	201410436605.5	申请日：	2014-08-29
公开（公告）号：	CN105447036B	公开（公告）日：	2019-08-16
发明（设计）人：	尚利峰;李斌阳;黄锦辉	申请（专利权）人：	华为技术有限公司
主分类号：	G06F16/953	分类号：	G06F16/953;G06Q50/00
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于观点挖掘社交媒体信息可信度评估方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种基于观点挖掘的社交媒体信息可信度评估方法及装置，方法包括：获取待评估信息；计算每条待评估信息的不确定性得分；计算每条待评估信息的发布者的可信度；统计每条待评估信息的评论中支持意见所占的比例；将每条待评估信息的不确定性得分，每条待评估信息的发布者的可信度及每条待评估信息的评论中支持意见所占的比例输入预先训练好的量化评估模型中进行计算，所述量化评估模型的输出为每条待评估信息的可信度排序。本发明实施例能够对社交媒体信息的可信度进行准确评估。

技术领域

本发明涉及通信技术领域，具体涉及一种基于观点挖掘的社交媒体信息可信度评估方法及装置。

背景技术

随着第二代互联网WEB2.0技术的发展和普及，各种类型的社交媒体(如：微博、微信、Twitter等)不断涌现并深刻地改变着人们发布、获取、交流、表达信息或观点的方式。特别是随着新一代无线通讯技术的成熟和智能移动设备的广泛使用，社交媒体已经成为人们日常生活中不可或缺的用来分享信息和表达观点的平台。但是由于该平台上的内容主要由大批网民自发创造、提取的，所以虚假、不可靠信息广泛存在。如何自动地评估社交媒体信息的可信度将对后续的信息推荐、市场调查、自动问答等应用系统的效果产生直接的影响。

现有技术提供的信息可信度分析主要针对某一特定领域、特定类型的数据，比如生物医学实验报告、新闻专线、维基百科等。以生物医学实验报告的可信度评估为例，由于该类数据有固定的结构和模式，所以可以很容易地提取不同的特征，特别是对于某一个课题有多篇与之相关的实验报告，所以可以通过实验报告之间的互相验证来鉴别出可信度低的实验报告。而维基百科信息的可信度主要是通过信息的修改记录来进行表征的。

即早期的信息可信度分析工具主要是为了特定结构化的数据而设计的，并没有考虑到社交媒体信息本身的数据结构特点和语言表达习惯，特别是社交媒体上的文本信息是一种非结构化的数据，该类数据的处理严重的依赖于自然语言处理技术：比如语义分析和情感分析等，所以这类早期的技术并不适用于社交媒体信息的可信度评估。因此，有必要提供一种新的方法对社交媒体信息的可信度进行评估。

发明内容

有鉴于此，本发明提供了一种基于观点挖掘的社交媒体信息可信度评估方法及装置，能够对社交媒体信息的可信度进行准确评估。

第一方面，本发明实施例提供的基于观点挖掘的社交媒体信息可信度评估方法，包括：

获取待评估信息；

计算每条待评估信息的不确定性得分；

计算每条待评估信息的发布者的可信度；

统计每条待评估信息的评论中支持意见所占的比例；

将每条待评估信息的不确定性得分，每条待评估信息的发布者的可信度及每条待评估信息的评论中支持意见所占的比例输入预先训练好的量化评估模型中进行计算，所述量化评估模型的输出为每条待评估信息的可信度排序。

结合第一方面，在第一方面的第一种实施方式中，在获取待评估信息之前，所述方法还包括：

构建与当前议题相关的主题词库；

将所述主题词库中的各个主题词与情感词库中的各个情感词组合形成观点词对；

获取与当前议题相关的社交媒体信息；