[发明专利]一种违规用户的确定方法、装置、电子设备及存储介质在审

专利信息
申请号: 202210557209.2 申请日: 2022-05-20
公开(公告)号: CN115203501A 公开(公告)日: 2022-10-18
发明(设计)人: 刘红林;刘洋 申请(专利权)人: 北京奇艺世纪科技有限公司
主分类号: G06F16/906 分类号: G06F16/906;G06K9/62
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 项京;孙翠贤
地址: 100080 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 违规 用户 确定 方法 装置 电子设备 存储 介质
【说明书】:

发明实施例提供了一种违规用户的确定方法、装置、电子设备及存储介质,上述方法包括:获取多个目标用户的第一用户属性数据和第一用户行为数据;提取多个违规用户的第二用户属性数据和第二用户行为数据,并确定用于反映违规用户特点的特征指标;从第一用户属性数据和第一用户行为数据中,确定出与特征指标对应的用户特征,并确定出用户特征对应的特征权重;根据用户特征和对应的特征权重计算每两个目标用户之间的相似度,并基于相似度对多个目标用户进行聚类,得到至少一个用户聚集;基于相似度以及预设规则,确定每个用户聚集是否属于违规用户聚集。采用该方法保证了所确定出的违规用户聚集的准确度,从源头上减少了低质内容,节省了人力资源。

技术领域

本发明涉及数据分析技术领域,特别是涉及一种违规用户的确定方法、装置、电子设备及存储介质。

背景技术

目前,很多应用平台的用户所上传的内容中存在大量低质内容。以视频平台为例,视频平台中存在很多标题夸张但是毫无实际内容的视频,用户观看这些视频无法获取任何有效信息。视频平台中还可能存在一些违规的黑产视频,例如色情视频。因此,为了保证平台的运营安全以及提高平台的内容质量,很多应用平台会对用户所上传的内容进行检测。

常用的内容检测方法是通过平台工作人员人工审核低质内容,然后提取低质内容的特征用以训练风控模型,例如,基于文本特征、图片特征和视频特征等训练风控模型,然后利用训练得到的风控模型检测用户上传到平台的内容是否合规。然而,这种检测方法只能依靠消耗大量的人力资源检测出一些违规内容,无法挖掘出违规用户之间的关联,更无法做到对违规用户进行准确聚类,进而利用聚类得到的违规用户从源头上实现违规内容拦截。

发明内容

本发明实施例的目的在于提供一种违规用户的确定方法、装置、电子设备及存储介质,以在不消耗大量人力资源的前提下,对违规用户进行准确聚类,实现检测平台的违规内容。

在本发明实施的第一方面,首先提供了一种违规用户的确定方法,包括:

获取多个目标用户的第一用户属性数据和第一用户行为数据;

提取预先获取的多个违规用户的第二用户属性数据和第二用户行为数据,并基于所述第二用户属性数据和所述第二用户行为数据,确定用于反映违规用户特点的特征指标;

针对每个目标用户,从所述第一用户属性数据和所述第一用户行为数据中,确定出与所述特征指标对应的数据,作为该目标用户的用户特征;

根据所述用户特征中各个元素的出现频率确定所述各个元素的权重,得到所述用户特征对应的特征权重;其中,元素的出现频率越低,则该元素对应的权重越高;

根据每个所述目标用户对应的用户特征和所述用户特征对应的特征权重,计算每两个目标用户之间的相似度,并基于所述相似度,对所述多个目标用户进行聚类,得到至少一个用户聚集;

针对每个用户聚集,基于该用户聚集所包括的目标用户之间的相似度以及预设规则,确定该用户聚集是否属于违规用户聚集。

可选的,所述针对每个用户聚集,基于该用户聚集所包括的目标用户之间的相似度以及预设规则,确定该用户聚集是否属于违规用户聚集,包括:

针对每个用户聚集,获取该用户聚集所包括的目标用户的风控等级和安全等级,以及,计算该用户聚集对应的用户聚集度;

基于所述风控等级、所述安全等级和所述用户聚集度,计算该用户聚集的风险分数;

如果所述风险分数位于黑灰产用户聚集或高危用户聚集对应的分数区间,确定该用户聚集属于违规用户聚集,如果所述风险分数位于正常用户对应的分数区间,确定该用户聚集不属于违规用户聚集。

可选的,所述根据每个所述目标用户对应的用户特征和所述用户特征对应的特征权重,计算每两个目标用户之间的相似度,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210557209.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top