[发明专利]一种基于倒排索引的互联网资产指纹识别方法与系统在审
申请号: | 202110794330.2 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113468395A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 刘山林 | 申请(专利权)人: | 山东林天信息科技有限责任公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/22;G06F16/906 |
代理公司: | 北京久维律师事务所 11582 | 代理人: | 邢江峰 |
地址: | 250013 山东省济南市历*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 索引 互联网 资产 指纹识别 方法 系统 | ||
1.一种基于倒排索引的互联网资产指纹识别方法,其特征在于,所述方法包括以下操作:
对互联网资产指纹进行响应头提取,对响应头中字段进行拆解,以倒排索引形式,排序键名,合并相同键名,靠拢相似键名,提取资产指纹的特征;
根据资产指纹特征,进行三元组、负载大小、协议特征、内容字符多模匹配、pcre正则匹配、优先级累加、匹配分值累加匹配核对,标记和分类获取的指纹资产,形成资产匹配识别规则。
2.根据权利要求1所述的一种基于倒排索引的互联网资产指纹识别方法,其特征在于,所述倒排索引形式为将key-value的形式转变为value-key的倒排形式。
3.根据权利要求1所述的一种基于倒排索引的互联网资产指纹识别方法,其特征在于,所述资产匹配识别规则为json格式,规则库中一行书写一条规则,注释行首书写一个或多个#。
4.根据权利要求1所述的一种基于倒排索引的互联网资产指纹识别方法,其特征在于,所述资产匹配识别规则中多条规则可匹配同一条资产指纹,如任一输出字段没有匹配到,则不论优先级会先填空值,然后同一优先级、同一类型复合相加。
5.一种基于倒排索引的互联网资产指纹识别系统,其特征在于,所述系统包括:
倒排索引模块,用于对互联网资产指纹进行响应头提取,对响应头中字段进行拆解,以倒排索引形式,排序键名,合并相同键名,靠拢相似键名,提取资产指纹的特征;
资产匹配模块,用于根据资产指纹特征,进行三元组、负载大小、协议特征、内容字符多模匹配、pcre正则匹配、优先级累加、匹配分值累加匹配核对,标记和分类获取的指纹资产,形成资产匹配识别规则。
6.根据权利要求5所述的一种基于倒排索引的互联网资产指纹识别系统,其特征在于,所述倒排索引形式为将key-value的形式转变为value-key的倒排形式。
7.根据权利要求5所述的一种基于倒排索引的互联网资产指纹识别系统,其特征在于,所述资产匹配识别规则为json格式,规则库中一行书写一条规则,注释行首书写一个或多个#。
8.根据权利要求5所述的一种基于倒排索引的互联网资产指纹识别系统,其特征在于,所述资产匹配识别规则中多条规则可匹配同一条资产指纹,如任一输出字段没有匹配到,则不论优先级会先填空值,然后同一优先级、同一类型复合相加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东林天信息科技有限责任公司,未经山东林天信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110794330.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型拼接式泳池滤芯
- 下一篇:一种锂离子电容器及其制备方法