[发明专利]用于区分目标网站内外链的方法及装置、电子设备、存储介质在审
申请号: | 202111674847.4 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114385950A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 马科;高静;杨哲;陈云柯;葛裴;夏立强 | 申请(专利权)人: | 中国信息通信研究院 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 陶俊洁 |
地址: | 100191 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 区分 目标 网站 内外 方法 装置 电子设备 存储 介质 | ||
1.一种用于区分目标网站内外链的方法,其特征在于,包括:
获取目标网站的第一ICP备案信息;
获取所述目标网站的待区分URL链接;
根据所述第一ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链。
2.根据权利要求1所述的方法,其特征在于,获取目标网站的第一ICP备案信息,包括:
访问所述目标网站的第一网站首页;
提取所述第一网站首页的内容;
在所述第一网站首页的内容中获取所述目标网站的第一ICP备案信息。
3.根据权利要求2所述的方法,其特征在于,获取所述目标网站的待区分URL链接,包括:
在获取到所述目标网站的第一ICP备案信息的情况下,在所述第一网站首页中提取所述目标网站的待区分URL链接。
4.根据权利要求2或3所述的方法,其特征在于,根据所述第一ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链,包括:
获取所述第一网站首页的第一主机字段;
获取所述待区分URL链接的第二主机字段;
在所述第一主机字段与所述第二主机字段相同的情况下,将所述待区分URL链接确定为所述目标网站的内链;
在所述第一主机字段与所述第二主机字段不相同的情况下,根据所述第一ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链。
5.根据权利要求4所述的方法,其特征在于,在所述第一主机字段与所述第二主机字段不相同的情况下根据所述第一ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链,包括:
在所述第一主机字段与所述第二主机字段不相同的情况下,根据所述第二主机字段访问所述待区分URL链接的第二网站首页;
提取所述第二网站首页的内容;
在所述第二网站首页的内容中获取所述待区分URL链接的第二ICP备案信息;
根据所述第一ICP备案信息和所述第二ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链。
6.根据权利要求5所述的方法,其特征在于,根据所述第一ICP备案信息和所述第二ICP备案信息区分所述待区分URL链接是目标网站的内链或外链,包括:
在所述第一ICP备案信息和所述第二ICP备案信息相同的情况下,确定所述待区分URL链接是所述目标网站的内链;和/或,
在所述第一ICP备案信息和所述第二ICP备案信息不相同的情况下,确定所述待区分URL链接是所述目标网站的外链。
7.一种用于区分目标网站内外链的装置,其特征在于,包括:
第一获取模块,被配置为获取目标网站的第一ICP备案信息;
第二获取模块,被配置为获取所述目标网站的待区分URL链接;
区分模块,被配置为根据所述第一ICP备案信息区分所述待区分URL链接是所述目标网站的内链或外链。
8.一种用于区分目标网站内外链的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至6任一项所述的用于区分目标网站内外链的方法。
9.一种电子设备,其特征在于,包括如权利要求9所述的用于区分目标网站内外链的装置。
10.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至6任一项所述的用于区分目标网站内外链的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国信息通信研究院,未经中国信息通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111674847.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于大容积罐体的内部补强结构及罐体
- 下一篇:一种电机和气阀控制电路