[发明专利]一种刷播放量的检测方法和装置有效
申请号: | 201810027743.6 | 申请日: | 2018-01-11 |
公开(公告)号: | CN108366274B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 补彬 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/24 | 分类号: | H04N21/24 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 放量 检测 方法 装置 | ||
本发明实施例提供了一种刷播放量的检测方法和装置,该方法和装置应用于视频播放网站,具体为将预设时间周期划分为多个时间窗口;获取待检测视频在每个时间窗口内的特征向量;将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;在待检测视频正常播放期间,获取待检测视频的播放数据;对待检测视频的播放数据与正常播放向量集进行比较;如果存在偏差数据,则判定待检测视频被恶意刷播放量;如果不存在偏差数据,则判定没有被恶意刷播放量。通过判定是否有刷播放量的发生,运营者可以及时进行干预、惩处或者采取其他相应措施,从而能够较好地避免其经济利益受损。
技术领域
本发明涉及互联网技术领域,特别是涉及一种刷播放量的检测方法和装置。
背景技术
由于目前法律法规还不太健全,且受经济利益驱使,黑产往往会有目的有组织的针对相应的视频播放网站刷播放量,以便使某些受益方获取非法利益。对于视频网站来说,这一行为会导致在统计相应视频的播放量时,得到的统计量远高于其实际播放量,在某些受益方获取非法利益的同时造成视频播放网站的运营者遭到经济损失;此外,实际播放量的异常还会影响到视频推荐服务的质量,从而造成用户体验下降。
发明内容
有鉴于此,本发明提供了一种刷播放量的检测方法和装置,以避免视频播放网站因非法刷播放量而导致运营者遭到经济损失。
为了解决上述问题,本发明公开了一种刷播放量的检测方法,应用于视频播放网站,其特征在于,所述检测方法包括步骤:
将预设时间周期划分为多个时间窗口;
获取待检测视频在每个时间窗口内的特征向量;
将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
对所述待检测视频的播放数据与所述正常播放向量集进行比较;
如果存在偏差数据,则判定所述待检测视频被恶意刷播放量;
如果不存在偏差数据,则判定没有被恶意刷播放量。
可选的,所述预设时间周期为24小时。
可选的,所述特征向量为所述待检测视频在所述时间窗口内的总访问次数、平均每分钟访问次数、总访问用户数、平均每分钟访问用户数、总访问IP数、平均每分钟访问IP数和总访问位置数中的部分或全部。
可选的,所述多个预设时间周期包括至少10个预设时间周期。
可选的,还包括步骤:
当判定没有恶意刷播放量时,将所述播放数据作为正常特征向量加入到所述正常播放向量集。
相应的,为了保证上述方法的实施,本发明还提供了一种刷播放量的检测装置,应用于视频播放网站,所述检测方法包括:
时间窗口划分模块,用于将预设时间周期划分为多个时间窗口;
特征向量获取模块,用于获取待检测视频在每个时间窗口内的特征向量;
第一聚类处理模块,用于将多个预设时间周期内所有时间窗口的特征向量进行聚类处理,得到所述待检测视频在多个预设时间周期内的播放向量集,去除其中的异常向量,得到正常播放向量集;
播放数据获取模块,用于在所述待检测视频正常播放期间,获取所述待检测视频的播放数据;
播放数据判断模块,用于对所述待检测视频的播放数据与所述正常播放向量集进行比较;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810027743.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分布式视频转码系统及分布式视频转码方法
- 下一篇:提供视频流的方法和装置