[发明专利]一种信息处理方法和装置有效
申请号: | 202010770466.5 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111652662B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 袁一涵;邓积杰;林星;白兴安;徐扬 | 申请(专利权)人: | 北京微播易科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京瀚群律师事务所 11581 | 代理人: | 王姗姗 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 | ||
1.一种信息处理方法,其特征在于,包括:
获取待预测账号发布的至少一条信息的至少两个互动类型的时间序列数据;
分别获取每条信息的每个时间序列数据的造假比例;
分别获取每条信息的每两个时间序列数据之间的相关系数;
根据每条信息对应的造假比例和相关系数,获取对应信息的信息造假率;
根据所述待预测账号发布的至少一条信息的信息造假率,获取所述待预测账号的账号造假率;
所述分别获取每条信息的每个时间序列数据的造假比例,包括:
分别判断每条信息的每个时间序列数据是否符合预设过滤规则;
当时间序列数据符合预设过滤规则时,获取该时间序列数据的造假比例0;
当时间序列数据不符合预设过滤规则时,对该时间序列数据进行处理,获取该时间序列数据的造假比例;
对于任意信息的任意两个时间序列数据,所述分别获取每条信息的每两个时间序列数据之间的相关系数,包括:
对该两个时间序列数据进行差分处理,得到两个增量时间序列数据;对该两个增量时间序列数据进行相关处理,得到该两个时间序列数据之间的相关系数;或者,
对该两个时间序列数据进行差分处理,得到两个增量时间序列数据;将该两个增量时间序列数据中符合预设策略的较小值置为0,得到两组待处理数据;对两组待处理数据进行Spearman秩相关处理,得到该两个时间序列数据之间的相关系数;
所述根据每条信息对应的造假比例和相关系数,获取对应信息的信息造假率,包括:通过预先训练的回归模型根据每条信息对应的造假比例和相关系数,获取对应信息的信息造假率。
2.根据权利要求1所述的信息处理方法,其特征在于,所述对该时间序列数据进行处理,获取该时间序列数据的造假比例的过程包括:
对该时间序列数据进行差分处理,得到增量时间序列数据;
对该增量时间序列数据进行归一化,得到归一化数据;
对所述归一化数据进行首尾复制填充,得到填充数据;
对所述填充数据进行两次差分处理,得到差分数据;
判断所述差分数据中每个点是否异常,得到判断结果;
根据所述增量时间序列数据对所述判断结果进行修正,得到该时间序列数据的造假比例。
3.根据权利要求1所述的信息处理方法,其特征在于,在所述分别获取每条信息的每个时间序列数据的造假比例之前,还包括:
分别对每条信息的每个时间序列数据进行差分处理,得到对应的增量时间序列数据;
所述分别获取每条信息的每个时间序列数据的造假比例,具体为分别获取每条信息的每个增量时间序列数据的造假比例;
所述分别获取每条信息的每两个时间序列数据之间的相关系数,具体为分别获取每条信息的每两个增量时间序列数据之间的相关系数。
4.根据权利要求3所述的信息处理方法,其特征在于,所述分别获取每条信息的每个增量时间序列数据的造假比例,包括:
分别判断每条信息的每个增量时间序列数据是否符合预设过滤规则;
当增量时间序列数据符合预设过滤规则时,获取该增量时间序列数据的造假比例0;
当增量时间序列数据不符合预设过滤规则时,对该增量时间序列数据进行处理,获取该增量时间序列数据的造假比例。
5.根据权利要求4所述的信息处理方法,其特征在于,所述对该增量时间序列数据进行处理,获取该增量时间序列数据的造假比例,包括:
对该增量时间序列数据进行归一化,得到归一化数据;
对所述归一化数据进行首尾复制填充,得到填充数据;
对所述填充数据进行两次差分处理,得到差分数据;
判断所述差分数据中每个点是否异常,得到判断结果;
根据所述增量时间序列数据对所述判断结果进行修正,得到该时间序列数据的造假比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京微播易科技股份有限公司,未经北京微播易科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010770466.5/1.html,转载请声明来源钻瓜专利网。