[发明专利]网页识别方法及装置和设置率确定方法和装置有效
申请号: | 201510924044.8 | 申请日: | 2015-12-14 |
公开(公告)号: | CN106874300B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 李新国;冯鸳鹤;吴茜 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 识别 方法 装置 设置 确定 | ||
本申请公开了一种网页识别方法及装置和设置率确定方法和装置。其中,该方法包括:从目标网站的访问日志中查询出目标访问日志,其中,目标访问日志为访问目标网站的首页页面的日志;对目标访问日志进行解析,提取出访问目标网站的首页页面的访问来源;判断访问来源的网页是否为目标网站中除首页页面之外的其他网页;以及在访问来源的网页是目标网站中除首页页面之外的其他网页时,确定访问来源的网页上设置有返回首页链接。本申请解决了现有技术中通过人工方式来确定网页上是否设置返回首页链接的效率低且工作量大的技术问题。
技术领域
本申请涉及互联网领域,具体而言,涉及一种网页识别方法及装置和设置率确定方法和装置。
背景技术
在互联网领域,为了提高网站的导航效果,通常会在网站中的网页上设置返回首页链接,用户在浏览网站的过程中可以直接通过该链接返回到网站的首页。网站返回首页链接设置率指的是网站中设置返回首页链接的网页占全部网页的比值。返回首页链接设置率这一指标在很大程度上反应了网站的用户体验情况,也是评价网站绩效的一项重要指标。
目前,通常是通过人工搜索的方式来确定网页上是否设置了返回首页链接。具体地,通过人工登陆访问网站,查看该网站的网页上是否设置了返回首页链接,进而统计设置了返回首页链接的网页数,用以计算返回首页链接设置率。然而,由于通过人工方式来确定网页上是否设置返回首页链接,其效率低且工作量大。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种网页识别方法及装置和设置率确定方法和装置,以至少解决现有技术中通过人工方式来确定网页上是否设置返回首页链接的效率低且工作量大的技术问题。
根据本申请实施例的一个方面,提供了一种网页识别方法,包括:从目标网站的访问日志中查询出目标访问日志,其中,所述目标访问日志为访问所述目标网站的首页页面的日志;对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源;判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页;以及在所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页时,确定所述访问来源的网页上设置有返回首页链接,其中,所述返回首页链接为设置在目标网站的网页上用于跳转回目标网站的首页页面的链接。
进一步地,判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页包括:判断所述访问来源的网页的统一资源定位符中包含的域名是否与所述目标网站的域名相同;在所述访问来源的网页的统一资源定位符中包含的域名与所述目标网站的域名相同时,确定所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页。
进一步地,对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源包括:从所述目标访问日志中解析出目标字段,其中,所述目标字段为记录有上一跳网页的统一资源定位符的字段。
进一步地,从目标网站的访问日志中查询出目标访问日志包括:将所述目标网站的首页页面对应的统一资源定位符与所述目标网站的访问日志进行匹配;将从所述目标网站的访问日志中匹配出的包含有所述目标网站的首页页面对应的统一资源定位符的访问日志作为所述目标访问日志。
根据本申请实施例的另一方面,还提供了一种设置率确定方法,包括:对目标网站的访问日志进行解析,统计出所述目标网站中被访问的网页总数;识别出目标网页,统计所述目标网页的数量,其中,所述目标网页为设置有返回首页链接的网页;以及根据所述网页总数和所述目标网页的数量计算得到所述目标网站上的所述返回首页链接的设置率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510924044.8/2.html,转载请声明来源钻瓜专利网。