[发明专利]一种虚假消息的识别方法及其设备有效
申请号: | 201810309691.1 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108830630B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 王健宗;黄章成;吴天博;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/205 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 陈宇 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 虚假 消息 识别 方法 及其 设备 | ||
1.一种虚假消息的识别方法,其特征在于,包括:
获取包含目标消息的多个载体文本,以及各个所述载体文本的传播路径;所述传播路径包括传播所述载体文本的传播用户的标识;
基于所述载体文本以及所述传播用户的标识,得到各个所述载体文本的文本矩阵;
将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量;
根据所有所述载体文本的传播路径,生成关于所述目标消息的用户传播矩阵;所述用户传播矩阵中包含的各元素具体为每个所述传播用户传播的载体文本的个数;
将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量;
根据所述用户传播特征向量以及所述文本特征向量,计算所述目标消息的真伪指数;
若所述真伪指数在预设的虚假指数范围内,则识别所述目标消息为虚假消息。
2.根据权利要求1所述的识别方法,其特征在于,所述将各个所述文本矩阵导入至预设的特征向量计算模型,得到所述目标消息的文本特征向量,包括:
分别获取各个所述载体文本的传播次数、内容特征参数以及传播时间参数;
基于所述传播时间参数对各个所述载体文本进行排序,确定各个所述载体文本的导入次序;
将所述传播次数、所述内容特征参数、所述传播时间参数以及所述文本矩阵,导入到文本时序向量转换模型,得到各个所述载体文本的文本时序向量;所述文本时序向量转换模型具体为:
其中,为导入次序为t的载体文本的所述文本时序向量;η为所述传播次数;ΔT为所述传播时间参数;xu为所述文本矩阵;xt为导入次序为t的载体文本的融合矩阵;xτ为所述内容特征参数;Wa以及ba为所述文本时序向量转换模型的预设调整系数;
基于所述导入次序,将各个所述载体文本的文本时序向量导入到多层反馈循环神经网络的各层级,得到所述目标消息的文本特征向量;所述多层反馈循环神经网络具体为:
其中,h0为预设的初始文本向量;为各个所述载体文本的文本时序向量;h1、h2…ht-1为所述多层反馈循环神经网络各层级输出的文本特征迭代中间值;ht为所述目标消息的文本特征向量;W、U、b为调整系数。
3.根据权利要求1所述的识别方法,其特征在于,所述将所述用户传播矩阵导入到预设的用户特征计算模型,得到所述目标消息对应的用户传播特征向量,包括:
对所述用户传播矩阵进行奇异值分解,得到各个所述传播用户的用户传播系数;
将各个所述用户传播系数分别导入到传播特征向量转换模型,确定各个所述传播用户的用户特征向量;所述用户特征向量转换模型具体为:
其中,si为第i个所述传播用户的用户特征向量;yi为第i个所述传播用户的用户传播系数;为第i个所述传播用户的用户时序向量;Wu、bu、以及bs为所述用户特征向量转换模型的预设系数;e为自然对数;
基于各个所述传播用户的用户特征向量,生成用户特征矩阵;
根据文本矩阵得到各个所述载体文本的掩码向量,并将所述掩码向量以及所述用户特征矩阵导入到用户传播特征值计算模型,确定各个所述载体文本的用户传播特征值;所述用户传播特征值计算模型具体为:
其中,[si]为所述用户特征矩阵;mj为第j篇所述载体文本的掩码向量;pj为第j篇所述载体文本的用户传播特征值;d([si]*mj)为非空元素统计函数;
根据各个所述用户传播特征值,生成所述目标消息的用户传播特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810309691.1/1.html,转载请声明来源钻瓜专利网。