[发明专利]指定类型网站的辨别方法和指定类型网站的辨别装置有效
申请号: | 201710227599.6 | 申请日: | 2017-04-10 |
公开(公告)号: | CN108694325B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 于琳琳;张丹;王九硕;于晓明 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种指定类型网站的辨别方法和指定类型网站的辨别装置,其中,指定类型网站的辨别方法包括:根据预设的探测方式,确定未知网站的网站入口,以确定未知网站的首页信息;提取未知网站的首页信息的结构特征;提取未知网站的首页信息的文本特征;对结构特征与文本特征进行加权处理,以生成未知网站的联合特征向量;确定联合特征向量与预设网站模型的特征向量的相似度,以确定未知网站是否为指定类型网站。通过本发明技术方案,利用较小的带宽实现对互联网指定类型网站的探测,此外,还可以做到对探测到的未知网站进行充分的辨别。 | ||
搜索关键词: | 指定 类型 网站 辨别 方法 装置 | ||
【主权项】:
1.一种指定类型网站的辨别方法,其特征在于,包括:根据预设的探测方式,确定未知网站的网站入口,以确定所述未知网站的首页信息;提取所述首页信息的结构特征;提取所述首页信息的文本特征;对所述结构特征与所述文本特征进行加权处理,以生成所述未知网站的联合特征向量;确定所述联合特征向量与预设网站模型的特征向量的相似度,以确定所述未知网站是否为所述指定类型网站。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710227599.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息泄露监控方法以及装置
- 下一篇:文本加密方法、装置及服务器