[发明专利]一种用于为网站生成网站地图的方法及系统有效
申请号: | 201611235483.9 | 申请日: | 2016-12-28 |
公开(公告)号: | CN108255831B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 刘海超;谢宇;张玉魁 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 郭一斐 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 网站 生成 地图 方法 系统 | ||
1.一种用于为网站生成网站地图的方法,所述方法包括:
确定网站地图的文件格式,并且基于所述文件格式确定需要收集的多个元数据;
以所述网站的网址作为数据收集起点,从所述数据收集起点开始收集所述网站的所有有效链接;
为所述所有有效链接中的每个有效链接确定需要收集的多个元数据;
根据用户预先设置的规则来修改所述多个元数据中的一个或多个元数据;
根据每个有效链接的经过修改的多个元数据中的一个或多个元数据,对每个有效链接进行分类,包括根据所述网站和有效链接的元数据实际内容进行分类,其中每个分类包括至少一个有效链接;以及
将每个分类中的至少一个有效链接生成网站地图子图,将多个网站地图子图进行组合以生成网站地图。
2.根据权利要求1所述的方法,其特征在于,所述网站地图的文件格式为HTML格式、XML格式或TXT格式。
3.根据权利要求1所述的方法,其特征在于,所述元数据为描述所述有效链接的短句或与所述有效链接相关的关键词。
4.根据权利要求1所述的方法,其特征在于,所述多个网站地图子图中每个网站地图子图的有效链接数量不超过5万条且多个网站地图子图中的每个网站地图子图的大小不超过10M。
5.根据权利要求1所述的方法,其特征在于,通过有效链接检测工具进行检测所述网站的链接是否为有效链接。
6.据权利要求5所述的方法,其特征在于,所述有效链接检测工具为站长工具或Xenu死链接检测工具。
7.根据权利要求1所述的方法,其特征在于,所述网站地图子图还包括与有效链接相应的多个元数据。
8.根据权利要求1所述的方法,其特征在于,所述网站地图生成后推送至搜索引擎接口和/或保存至网站的根目录。
9.一种用于为网站生成网站地图的系统,包括:
初始单元,用于确定网站地图的文件格式,并且基于所述文件格式确定需要收集的多个元数据;
链接收集单元,以所述网站的网址作为数据收集起点,从所述数据收集起点开始收集所述网站的所有有效链接;
元数据收集单元,为所述所有有效链接中的每个有效链接确定需要收集的多个元数据;
元数据修改单元,根据用户预先设置的规则来修改所述多个元数据中的一个或多个元数据;
分类单元,根据每个有效链接的经过修改的多个元数据中的一个或多个元数据,对每个有效链接进行分类,其中每个分类包括至少一个有效链接;
网站地图生成单元,用于将每个分类中的至少一个有效链接生成网站地图子图,将多个网站地图子图进行组合以生成网站地图。
10.根据权利要求9所述的系统,其特征在于,还包括有效链接检测工具,用于检测所述网站的连接是否为有效链接。
11.根据权利要求10所述的系统,其特征在于,所述有效链接检测工具为站长工具或Xenu死链接检测工具。
12.根据权利要求9所述的系统,其特征在于,所述网站地图的文件格式为HTML格式、XML格式或TXT格式。
13.根据权利要求9所述的系统,其特征在于,所述元数据为描述所述有效链接的短句或与所述有效链接相关的关键词。
14.根据权利要求9所述的系统,其特征在于,所述多个网站地图子图中每个网站地图子图的有效链接数量不超过5万条且多个网站地图子图中的每个网站地图子图的大小不超过10M。
15.根据权利要求9所述的系统,其特征在于,所述网站地图子图还包括与有效链接相应的多个元数据。
16.根据权利要求9所述的系统,其特征在于,所述网站地图生成后推送至搜索引擎接口和/或保存至网站的根目录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611235483.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在线资源管理方法及装置
- 下一篇:舆情处理系统及方法