[发明专利]基于动态表达学习的不实信息检测方法和装置在审

申请号：	201710085225.5	申请日：	2017-02-16
公开（公告）号：	CN106910013A	公开（公告）日：	2017-06-30
发明（设计）人：	谭铁牛;王亮;吴书;刘强;余峰	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06Q10/06	分类号：	G06Q10/06;G06Q50/00;H04L29/06
代理公司：	中科专利商标代理有限责任公司11021	代理人：	钟文芳
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于动态表达学习不实信息检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机模型检测技术领域，尤其涉及一种基于动态表达学习的不实信息检测方法和装置。

背景技术

社交媒体的飞速发展使网络用户体验到了前所未有的便捷。社交媒体例如Facebook，Twitter和新浪微博为用户提供了可以共享信息和公开发表个人能言论的平台。但与此同时，社交平台上不实信息的传播也为用户带来了极大的困扰，也危害了社会和谐和公共安全。近年来，信息可信度检测引起了学术界和工业界极大的关注。

现今方法中考虑到的信息主要包括以下几个种类：正文信息、来源可信信息、动态信息和评论信息；评价用户行为可信度因素主要包括：时间、人物、行为、方式。事实发现法是一种无监督或半监督方法，用于在冲突数据中发现事实和检测信息可信度。基于上述信息，已有方法主要关注于人工特征，但其较为繁琐并且无法得出数据的基本特征。同时，现今方法无法模拟信息传播时不同信息种类和不同可信性因素的关联性。事实发现法主要基于来源可信信息且检测到的可信度集合于各个来源。但事实发现法仅适合于在理想情况特定的主题中，例如价格预测和航班预测，并不适用于社交媒体这种复杂环境之中。

近年来，很多在社交媒体能自动测量信息可信度的方法得到广泛的应用。这些方法主要基于消息级别或事件级别的正文信息和来源可信信息。还有研究综合考虑了消息级别和事件级别。针对于动态信息，一些研究定义了传播过程中的时间特征或者训练具有不同时间段特征的模型。针对于评论信息，研究采取了用户反馈或标志微博方式表明可疑信息。尽管这些方法被广泛使用，但因建立在特征工程上，就显得较为繁琐并且无法得出数据的基本特征。同时，现今方法无法模拟信息传播时不同信息种类和不同可信性因素的关联性。

DBRM模型致力于根据社交媒体上用户发布和转发的内容来判断该事件是否为不实信息。模型集合用户行为因素：用户可信度、事件发生时间间隔、用户发布和转发行为和用户评论信息，可用来判断一条消息的可信度。模型引入了表征学习方法(representation learning method)，与传统特征工程(feature engineering)不同的是的它能够抓取在传播过程中不同方面的信息。模型学习了用户，动态时间间隔，用户行为和评论态度的隐含表示(1atent representation)。基于这些隐含表示，模型可生成信息的动态行为表示并在可信度检测方面提出了创新。

发明内容

鉴于传统基于人工特征的方法存在技术缺陷，为了更好检测信息可信度，本发明提供一种基于动态行为特征表示的检测方法和装置。

根据本发明一方面，提供了一种基于动态表达学习的不实信息检测方法，包括以下步骤：

获取待检测信息；

利用预先建立的检测模型对所述待检测信息进行检测；

输出检测结果；

其中，检测模型如下建立：

步骤S1，首先建模联合表示用户信息和该用户行为信息的某一事件的动态行为表达式；用户信息包含用户的特征和用户可信度，行为信息包含行为类型；

步骤S2，一个事件由不同信息组成，结合步骤S1中的所述动态行为表达式，最终得出事件可信度检测表达式；

步骤S3，运用时间特征矩阵来取得在信息传播过程中用户动态行为特征连

步骤S4，生成用户特征表达；

步骤S5，利用配对学习法估算检测模型参数。