[发明专利]一种网站识别的方法、装置及电子设备在审
申请号: | 202210655921.6 | 申请日: | 2022-06-10 |
公开(公告)号: | CN115098815A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 杨胜永;张泽鑫;欧帅;范敦球 | 申请(专利权)人: | 绿盟科技集团股份有限公司;北京神州绿盟科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06K9/62;G06N7/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 路晓丹 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网站 识别 方法 装置 电子设备 | ||
1.一种网站识别的方法,其特征在于,所述方法包括:
将各个候选网站的网站特征与参考特征进行匹配,得到所述各个候选网站各自的匹配结果;
从所述各个候选网站中,选取匹配结果满足预设条件的候选网站作为待识别网站;
基于获得的各个待识别网站,确定所述各个待识别网站的网站特征各自对应的目标概率;其中,目标概率表征:网站特征与各个类别网站之间的各个匹配概率中的最大匹配概率;
根据所述目标概率对应的网站类别,识别出所述各个待识别网站的网站类别。
2.如权利要求1所述的方法,其特征在于,所述将各个候选网站的网站特征与参考特征进行匹配,得到所述各个候选网站各自的匹配结果,包括:
将各个候选网站各自关联的对象信息与参考特征的对象信息进行匹配,得到所述各个候选网站各自对象信息的匹配结果,其中,所述对象信息包含注册者、注册者邮箱、注册者手机号;和/或
将所述各个候选网站各自的网站标识与所述参考特征中包含的各个参考网站的网站标识进行匹配,得到所述各个候选网站各自的网站标识对应的匹配结果。
3.如权利要求1-2任一项所述的方法,其特征在于,所述从所述各个候选网站中,选取匹配结果满足预设条件的候选网站作为待识别网站,包括:
在所述各个候选网站对应的匹配结果中判定是否存在网站特征与参考特征之间匹配成功的匹配结果;
若是,则将匹配成功的匹配结果对应的候选网站作为待识别网站。
4.如权利要求1-2任一项所述的方法,其特征在于,所述从所述各个候选网站中,选取匹配结果满足预设条件的候选网站作为待识别网站,包括:
从所述各个候选网站中,选取匹配结果满足预设条件的候选网站作为待筛选网站;
从选取的各个待筛选网站中,筛选与预设数据库中各个网站的任一网站特征不匹配的待筛选网站作为待识别网站。
5.如权利要求1-2任一项所述的方法,其特征在于,所述确定所述各个待识别网站的网站特征各自对应的目标概率,包括:
确定所述各个待识别网站的网站特征各自在第一指定网站类别条件下的第一条件概率;
确定所述各个待识别网站的网站特征各自在第二指定网站类别条件下的第二条件概率;
在所述各个待识别网站的网站特征各自对应的第一条件概率和第二条件概率中,选取最大的条件概率作为所述各个待识别网站的网站特征各自对应的目标概率。
6.如权利要求5所述的方法,其特征在于,所述根据所述目标概率对应的网站类别,识别出所述各个待识别网站的网站类别,包括:
若所述目标概率对应所述第一指定网站类别,则所述目标概率对应的待识别网站的网站类别为第一指定网站类别;
若所述目标概率对应所述第二指定网站类别,则所述目标概率对应的待识别网站的网站类别为第二指定网站类别。
7.一种网站识别的装置,其特征在于,所述装置包括:
匹配模块,将各个候选网站的网站特征与参考特征进行匹配,得到所述各个候选网站各自的匹配结果;
选取模块,从所述各个候选网站中,选取匹配结果满足预设条件的候选网站作为待识别网站;
确定模块,基于获得的各个待识别网站,确定所述各个待识别网站的网站特征各自对应的目标概率;其中,目标概率表征:网站特征与各个类别网站之间的各个匹配概率中的最大匹配概率;
识别模块,根据所述目标概率对应的网站类别,识别出所述各个待识别网站的网站类别。
8.如权利要求7所述的装置,其特征在于,所述匹配模块,具体用于:
将各个候选网站各自关联的对象信息与参考特征中对象信息进行匹配,得到所述各个候选网站各自对象信息的匹配结果,其中,所述对象信息包含注册者、注册者邮箱、注册者手机号;和/或
将所述各个候选网站各自的网站标识与所述参考特征中包含的各个参考网站的网站标识进行匹配,得到所述各个候选网站各自的网站标识对应的匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绿盟科技集团股份有限公司;北京神州绿盟科技有限公司,未经绿盟科技集团股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210655921.6/1.html,转载请声明来源钻瓜专利网。