[发明专利]用户识别方法和装置在审
申请号: | 202110343619.2 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113129054A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 张泽磊;李健宇 | 申请(专利权)人: | 广州博冠信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;H04N21/441 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 赵昀彬;宫传芝 |
地址: | 510600 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 | ||
本发明公开了一种用户识别方法和装置。其中,该方法包括:获取第一特征集合,其中,第一特征集合包括:第一用户的多个第一特征和第二用户的多个第一特征,第一用户为属于正常行为的用户,第二用户为存在异常行为的用户;基于第一特征集合中的第一特征之间的相似度,对第一特征进行筛选,得到目标特征集合;基于目标特征集合,构建训练数据;利用训练数据对用户识别模型进行训练,其中,用户识别模型用于检测待识别用户是否存在异常行为。本发明解决了相关技术中用户识别的效率和准确率较低的技术问题。
技术领域
本发明涉及互联网安全领域,具体而言,涉及一种用户识别方法和装置。
背景技术
随着直播行业的发展,不仅吸引了海量观众,同时也吸引了大量系统通过作弊手段盈利的非法用户,非法用户的存在会对直播平台造成严重损失,并且影响正常用户的使用体验。
为了解决上述问题,相关技术中提供了一种使用规则的方法进行用户识别,该方法通过对用户IP、用户弹幕、用户账号等级、用户MAC(Medium Access Control,物理地址)等维度建立规则,满足规则会增加一定的分数,当总分数超过一定阈值时可以认为该用户属于非法用户,不超过该阈值则认为该用户属于正常用户。
但是,由于规则对应的分数以及阈值需要经过多次迭代才能确定,导致用户识别效率降低,而且,规则用户被非法用户通过多次尝试而绕过,导致用户识别准确度降低。针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种用户识别方法和装置,以至少解决相关技术中用户识别的效率和准确率较低的技术问题。
根据本发明实施例的一个方面,提供了一种用户识别方法,包括:获取第一特征集合,其中,第一特征集合包括:第一用户的多个第一特征和第二用户的多个第一特征,第一用户为属于正常行为的用户,第二用户为存在异常行为的用户;基于第一特征集合中的第一特征之间的相似度,对第一特征进行筛选,得到目标特征集合;基于目标特征集合,构建训练数据;利用训练数据对用户识别模型进行训练,其中,用户识别模型用于检测待识别用户是否存在异常行为。
可选地,获取第一特征集合包括:获取第一用户的第一行为数据,以及第二用户的第二行为数据,其中,第一行为数据与第二行为数据的类型相同;基于第一行为数据和第二行为数据,生成第二特征集合;生成每个第二特征对应的特征箱型图,其中,箱型图包括:第一用户的第一箱型图和第二用户的第二箱型图;基于每个第二特征对应的特征箱型图,对第二特征集合中的第二特征进行筛选,得到第一特征集合。
可选地,基于每个第二特征对应的特征箱型图,对第二特征集合中的第二特征进行筛选,得到第一特征集合包括:将每个第二特征对应的第一箱型图和第二箱型图进行比较,得到每个第二特征对应的比较结果,其中,比较结果用于表征第一用户的第一数据分布与第二用户的第二数据分布的相似度是否小于第一阈值;基于比较结果,对第二特征集合中的第二特征进行筛选,得到第一特征集合,其中,筛选出的第二特征对应的比较结果为第一数据分布与第二数据分布的相似度小于第一阈值。
可选地,基于第一行为数据和第二行为数据,生成第二特征集合包括:确定第二用户的行为数据中存在异常的行为数据,得到目标行为数据;对目标行为数据进行特征提取,得到第二特征集合。
可选地,基于第一特征集合中的第一特征之间的相似度,对第一特征进行筛选,得到目标特征集合包括:基于第一特征集合中的第一特征之间的相似度,生成热力图;获取第一特征的模型评价指标值,其中,模型评价指标值用于表征通过用户识别模型识别得到的正例样本排在反例样本前面的比例;基于热力图和模型评价指标值对第一特征进行筛选,得到目标特征集合。
可选地,获取第一特征的模型评价指标值包括:利用第一特征训练用户识别模型进行训练,得到模型评价指标值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州博冠信息科技有限公司,未经广州博冠信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343619.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于遗传算法的个性化试卷推送方法
- 下一篇:一种带备用电源的计算机主机