[发明专利]基于机器学习分析指纹相似度的跨浏览器设备识别方法有效
申请号: | 201810131458.9 | 申请日: | 2018-02-09 |
公开(公告)号: | CN108364022B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 程进;魏兴国;聂万泉 | 申请(专利权)人: | 杭州默安科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L29/08;H04L29/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 分析 指纹 相似 浏览器 设备 识别 方法 | ||
1.一种基于机器学习分析指纹相似度的跨浏览器设备识别方法,其特征在于,包括以下步骤:
采集设备指纹特征信息,并将所述设备指纹特征信息上传到服务端;
在数据库中查找是否存在相同的设备指纹,若存在,则判断为回访设备;否则,将所述设备指纹特征信息存储到所述数据库中;
所述服务端对所述设备指纹特征信息进行分类;
所述服务端对不同分类中的每种特征信息使用特征距离函数计算特征距离,然后再使用指纹组距离函数计算指纹组距离;
采用机器学习模型判断所述设备指纹特征信息是否为回访设备的指纹特征信息,如果是,则判定为回防设备,否则为新设备;
其中,所述采集设备指纹特征信息,并将所述设备指纹特征信息上传到服务端为,通过Web站点加载Javascript,采集21种设备指纹特征信息,并将所述所述设备指纹特征信息通过Ajax上传到服务端;所述21种设备指纹特征信息为屏幕分辨率、时区、CPU类型、平台、触感屏特征、像素比、IP组,核心数、GPU硬件信息、声卡硬件信息、字体、浏览器用户代理、语言、插件、GPU渲染图片透明度alpha=0.2、GPU渲染图片透明度alpha=0.4、GPU渲染图片透明度alpha=0.6、GPU渲染图片透明度alpha=0.8、GPU渲染图片纹理值、GPU渲染图片光照、音频指纹;所述服务端对所述设备指纹特征信息进行分类为,对所述21种设备指纹特征信息进行分类,分类类别包括标称特征、二元特征和列表特征,其中,所述二元特征为触感屏特征;所述标称特征为屏幕分辨率、时区、CPU类型、平台、像素比、IP组,核心数、GPU硬件信息、声卡硬件信息、字体、浏览器用户代理、语言、插件;所述列表特征为GPU渲染图片透明度alpha=0.2、GPU渲染图片透明度alpha=0.4、GPU渲染图片透明度alpha=0.6、GPU渲染图片透明度alpha=0.8、GPU渲染图片纹理值、GPU渲染图片光照、音频指纹;
所述标称特征对应的标称特征距离函数为,其中,xi为有一定取值范围的字符串;
所述二元特征对应的二元特征距离函数为,
其中,xi∈{0,1};
所述列表特征的对应的列表特征距离函数为,
其中,为中不同元素的个数,为交集的总元素数;
所述机器学习模型为KNN模型。
2.如权利要求1所述的一种基于机器学习分析指纹相似度的跨浏览器设备识别方法,其特征在于,所述指纹组距离函数为,
其中,ymn为用户Um跟用户Un指纹组的距离,k为特征总数,wi为第i个特征的权值。
3.如权利要求1或2所述的一种基于机器学习分析指纹相似度的跨浏览器设备识别方法,其特征在于,所述KNN模型的距离阈值S为[3,3.5],邻近数K为[4,7]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州默安科技有限公司,未经杭州默安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810131458.9/1.html,转载请声明来源钻瓜专利网。