[发明专利]一种用户识别方法、装置、设备及存储介质在审
申请号: | 201910205259.2 | 申请日: | 2019-03-18 |
公开(公告)号: | CN111723349A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 周奇;罗剑江;胡泽柱 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F21/31 | 分类号: | G06F21/31 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 成丹 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 识别 方法 装置 设备 存储 介质 | ||
本申请公开了一种用户识别方法、装置、设备及存储介质。该方法包括:获取当前用户在终端上操作至少一个访问对象的第一行为特征和第二行为特征,第一行为特征用于表征当前用户操作访问对象的行为倾向,第二行为特征用于表征当前用户操作访问对象的行为习惯;将第一行为特征和第二行为特征输入到预先创建的用户分类模型,以确定当前用户是否为与终端存在绑定关系的用户。根据本申请实施例提供的技术方案,该方法提高了用户识别的准确率。
技术领域
本申请一般涉及计算机技术领域,具体涉及数据处理领域,尤其涉及一种用户识别方法、装置、设备及存储介质。
背景技术
随着科学技术的发展,人们的生活和工作方式也有了很大的改变,例如,越来越多的商业企业信息,个人信息都存储在终端内。为了防范商业企业机密泄露、个人信息的泄露,提高信息安全,需要对用户进行识别。
目前,一般通过为终端设置进入密码来识别用户。然而进入密码很容易被泄露或破解,这样就不能准确识别用户。
发明内容
鉴于现有技术不能准确识别用户的问题,本申请提出了一种用户识别方法、装置、设备及存储介质,能够提高用户识别的准确率。
第一方面,本申请实施例提供了一种用户识别方法,该方法包括:
获取当前用户在终端上操作至少一个访问对象的第一行为特征和第二行为特征,第一行为特征用于表征当前用户操作访问对象的行为倾向,第二行为特征用于表征当前用户操作访问对象的行为习惯;
将第一行为特征和第二行为特征输入到预先创建的用户分类模型,以确定当前用户是否为与终端存在绑定关系的用户。
可选地,获取当前用户在终端上操作至少一个访问对象的第一行为特征和第二行为特征包括:
获取会话周期内当前用户在终端上操作至少一个访问对象的日志记录;
从日志记录中提取第一行为特征和第二行为特征。
可选地,从日志记录中提取第一行为特征至少包括以下一项或多项:
利用隐含狄利克雷分布模型从日志记录中提取至少一个访问对象的主题特征;
利用词频-逆文档频率算法提取至少一个访问对像的目的IP地址的词频-逆文档频率值;
确定日志记录对应的各访问对象的数量与访问对象总数量的比值;
确定日志记录对应的各网络行为的数量与网络行为总数量的比值。
可选地,利用隐含狄利克雷分布模型从日志记录中提取至少一个访问对象的主题特征包括:
提取会话周期内日志记录包括的多个网页标题;
合并各网页标题,得到网页标题文本;
对网页标题文本进行处理,得到词语列表;
将词语列表输入到预先创建的隐含狄利克雷分布模型,以输出与至少一个访问对象对应的主题特征。
可选地,利用词频-逆文档频率算法提取至少一个访问对像的目的 IP地址的词频-逆文档频率值包括:
在会话周期内,将日志记录中多个目的IP地址按照访问时间先后顺序排列,得到目的IP地址列表;
将目的IP地址列表输入到预先创建的词频-逆文档频率算法模型,以输出与目的IP地址相对应的词频-逆文档频率值。
可选地,从日志记录中提取第二行为特征至少包括以下一项或多项:
获取访问对象按照时间排序后的日志记录集合,并计算记录集合中相邻两条日志记录的时间间隔的平均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910205259.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电感元件于绝缘胶座中成型结构
- 下一篇:天线组件以及电子设备