[发明专利]指纹识别方法、设备和存储介质有效
申请号: | 201911180834.4 | 申请日: | 2019-11-27 |
公开(公告)号: | CN111061934B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 陈毅聪;刘浩杰;李宇欣 | 申请(专利权)人: | 西安四叶草信息技术有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/958 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 韩畅 |
地址: | 710086 陕西省西安市高新区鱼化*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 指纹识别 方法 设备 存储 介质 | ||
1.一种指纹识别方法,其特征在于,所述方法包括:
获取目标网页的网址信息,所述网址信息包括所述目标网页的URL;
通过网络爬虫对所述目标网页的网址信息进行爬取,获取所述目标网页的目标特征信息;
获取所述目标特征信息的目标权重;
在所述目标特征信息的目标权重满足预设条件时,将所述目标特征信息确定为所述目标网页的指纹信息;
所述获取所述目标特征信息的目标权重包括:
根据所述目标特征信息和预设的目标特征库,获取所述目标特征信息的全局权重和应用权重;根据所述目标特征信息的全局权重和应用权重,计算得到所述目标特征信息的目标权重;
所述根据所述目标特征信息和预设的目标特征库,获取所述目标特征信息的全局权重和应用权重包括:
判断所述目标特征库中是否包含所述目标特征信息;
在所述目标特征库中未包含所述目标特征信息时,将预设的初始全局权重确定为所述目标特征信息的全局权重,将预设的初始应用权重确定为所述目标特征信息的应用权重;
在所述目标特征库中包含所述目标特征信息时,将所述目标特征信息在所述目标特征库所占的比例确定为所述目标特征信息的全局权重,将在原始应用权重的基础上增加预设步长后确定为所述目标特征信息的应用权重,所述原始应用权重用于指示上一次所述目标特征信息的应用权重。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标特征信息的全局权重和应用权重,计算得到所述目标特征信息的目标权重包括:
从所述目标特征库中获取与目标特征信息所关联的应用下所有特征信息的应用权重总和;
根据所述目标特征信息的应用权重M和所述与目标特征信息所关联的应用下所有特征信息的应用权重总和N,利用第一公式和第二公式计算得到第一参数TF和第二参数IDF;
根据所述第一参数TF、第二参数IDF和所述目标网页的全局权重P,利用第三公式计算得到所述目标特征信息的目标权重Q;
其中,所述第一公式为:TF=MN,所述第二公式为:所述第三公式为:Q=TF*IDFP。
3.根据权利要求1所述的方法,其特征在于,在所述目标特征信息的目标权重满足预设条件时,将所述目标特征信息确定为所述目标网页的指纹信息包括:
对所述目标特征信息的目标权重进行归一化处理,得到归一化的目标权重;
判断所述归一化的目标权重是否达到预设阈值;
在所述归一化的目标权重达到预设阈值时,将所述目标特征信息确定为所述目标网页的指纹信息。
4.根据权利要求1所述的方法,其特征在于,所述通过网络爬虫对所述目标网页的网址信息进行爬取,获取所述目标网页的目标特征信息包括:
通过网络爬虫对所述目标网页的网址信息进行爬取,得到所述目标网页的网页流量;
对所述目标网页的网页流量进行特征提取,得到所述目标网页的目标特征信息。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标网页的网页流量进行特征提取,得到所述目标网页的目标特征信息包括:
从所述目标网页的网页流量中提取有效数据;
对所述有效数据进行特征提取,将所述有效数据的特征信息确定为所述目标网页的目标特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安四叶草信息技术有限公司,未经西安四叶草信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911180834.4/1.html,转载请声明来源钻瓜专利网。