[发明专利]评估模型生成及设备关联方法、装置及存储介质在审
申请号: | 201910948387.6 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110866241A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 李妙洋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F21/44 | 分类号: | G06F21/44;G06F21/31 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估 模型 生成 设备 关联 方法 装置 存储 介质 | ||
1.一种评估模型生成方法,其特征在于,包括:
分别获取作为采集对象的各第一设备的预定设备信息;
将所述第一设备中的部分或全部进行两两组合,得到大于一组第一设备对;
针对每组第一设备对,分别构建一条训练样本;每条训练样本中分别包括:根据所述第一设备对中的两个第一设备的预定设备信息确定出的设备对特征,以及,所述第一设备对中的两个第一设备是否属于同一用户的样本标签;
根据所述训练样本训练得到评估模型,以便针对由待评估的任意两个第二设备组成的第二设备对,根据所述评估模型及获取到的所述第二设备对的设备对特征,确定出所述两个第二设备是否属于同一用户。
2.根据权利要求1所述的方法,其特征在于,
所述预定设备信息包括:APP行为数据以及APP安装列表信息。
3.根据权利要求2所述的方法,其特征在于,
所述分别获取作为采集对象的各第一设备的预定设备信息包括:
收集预定时长内的各第一设备的原始数据;
从所述原始数据中抽取出所述APP行为数据及所述APP安装列表信息;
分别将属于同一第一设备的所述APP行为数据以及所述APP安装列表信息进行聚合,作为获取到的各第一设备的预定设备信息。
4.根据权利要求3所述的方法,其特征在于,
所述APP行为数据包括:设备标识、产生APP行为的时间戳以及APP标识;
所述APP安装列表信息包括:设备标识、采集APP安装列表的时间戳以及APP安装列表;
所述分别将属于同一第一设备的所述APP行为数据以及所述APP安装列表信息进行聚合包括:
按照所述设备标识,分别将属于同一第一设备的所述APP行为数据以及所述APP安装列表信息进行聚合。
5.根据权利要求3所述的方法,其特征在于,
所述分别将属于同一第一设备的所述APP行为数据以及所述APP安装列表信息进行聚合之前,进一步包括:
对抽取出的所述APP行为数据进行清洗,过滤掉不符合要求的所述APP行为数据;
和/或,对抽取出的所述APP安装列表信息进行清洗,过滤掉不符合要求的所述APP安装列表信息。
6.根据权利要求3所述的方法,其特征在于,
所述分别将属于同一第一设备的所述APP行为数据以及所述APP安装列表信息进行聚合之后,进一步包括:
针对任一第一设备,若聚合得到的APP行为数据条数大于预定阈值,则仅保留与所述阈值等同条数的APP行为数据。
7.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:针对任一第一设备对,若确定所述第一设备对中的两个第一设备上曾登陆过同一用户账号标识,则确定所述第一设备对中的两个第一设备属于同一用户。
8.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:从构建出的训练样本中过滤掉不符合要求的负样本,所述负样本为对应的第一设备对中的两个第一设备不属于同一用户的训练样本。
9.一种设备关联方法,其特征在于,包括:
针对待评估的任意两个第二设备,分别获取各第二设备的预定设备信息;
根据所述预定设备信息确定出所述两个第二设备组成的第二设备对的设备对特征;
根据所述设备对特征,基于根据权利要求1-8所述的评估模型生成方法生成的评估模型,确定出所述两个第二设备是否属于同一用户。
10.根据权利要求9所述的方法,其特征在于,
所述预定设备信息包括:APP行为数据以及APP安装列表信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910948387.6/1.html,转载请声明来源钻瓜专利网。