[发明专利]一种在Web页面中添加标签的方法及其系统有效
申请号: | 200610127213.6 | 申请日: | 2006-09-12 |
公开(公告)号: | CN101145936A | 公开(公告)日: | 2008-03-19 |
发明(设计)人: | 李江华;张金银;李昂 | 申请(专利权)人: | 阿里巴巴公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 魏彬 |
地址: | 英属开曼群岛*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 web 页面 添加 标签 方法 及其 系统 | ||
技术领域
本发明涉及互联网数据分析领域,特别涉及一种在Web页面中添加标签的方法及其系统。
背景技术
随着互联网上信息服务的发展,许多政府部门、公司、大专院校、科研院所等都已经拥有或正在建设自己的网站。每个网站的后面都运行着一个Web服务器,Web服务器也称为WWW(World Wide Web)服务器,主要功能是提供网上信息浏览服务。WWW是互联网Internet的多媒体信息查询工具,是Internet近年才发展起来的服务,也是发展最快和目前应用最广泛的服务。WWW采用的是客户端/服务器结构,WEB服务器的作用是整理和储存各种WWW资源,并响应客户端请求,把用户所需的资源传送到Windows95、Windows98、WindowsNT、UNIX或Linux等平台上;如Web服务器负责管理Web页面,在接收用户请求后将相应的页面通过本地网络或Internet传送至客户端Web浏览器以供用户使用。现在较常用的Web服务器包括Apache服务器、Microsoff IIS服务器和Iplanet的Enterprise服务器。
对网站的管理,要求不仅仅关注Web服务器每天的吞吐量,还要了解网站各页面的访问情况,根据各页面的点击频率来改善网页的内容和质量、提高信息的可读性,跟踪包含有商业交易的步骤以及管理网站的后台数据等,尤其是以电子商务或搜索引擎为业务的网络公司,更是需要对Web服务器的运行和访问情况进行详细而周全的分析以跟踪用户的行为;而这些要求都可以通过对Web服务器的日志文件进行统计和分析来做到。
目前,市场上有两种较为流行的日志文件的生成方式。
一种方式是由Web服务器直接生成日志文件。参阅图1所示,用户通过客户机发送Web页面浏览请求到Web服务器;Web服务器接收该请求后,将用户请求浏览的Web页面返回给客户端,并记录对应的访问日志;最后由日志文件服务器统一收集分散在各个Web服务器上的访问日志并进行分析、整理。
这种方法的主要缺点是,日志文件分散在各台Web服务器上,如果要进行分析,需要收集日志文件并进行处理。一般的以电子商务为主的网站,如果日浏览量超过五千万,就需要上百台Web服务器为其提供服务;收集上百台机器的访问日志,需要花费较长时间,又会影响Web服务器的负载,同时,由于Web服务器数量太多,日志文件服务器很容易遗漏部分访问日志,导致数据分析结果的不可靠。
另一种方式是采用标签(Tag)生成日志文件。用户通过客户端发送Web页面浏览请求到Web服务器;Web服务器将相应的已嵌入Tag的Web页面发送给客户端,所述Tag为一小段代码,一般为Javascript代码;客户端根据所述Web页面上嵌入的Tag生成对应的访问信息,并将该访问信息发送给日志文件服务器;日志文件服务器根据所述访问信息生成相应的访问日志并向客户端返回请求结果,接着对所述访问日志进行分析、整理。
这种方式直接将需要分析的访问日志集中生成在日志文件服务器,减少了日志收集的过程。但是,对于Tag的生成方式,现有技术还存在不足之处。
一般来说,用户访问的Web页面分为静态页面和动态页面两种。所述静态页面是指该页面只对应一个固定的页面内容;所述动态页面是指该页面可以依据预先设定的页面程序,根据用户的不同请求返回相应的数据。
对于静态页面,网站工程师先在页面代码中确定Tag的指定嵌入位置,再将Tag手工嵌入到所述位置上,有多少个静态页面网站工程师就需要手工嵌入Tag代码多少次;如果一个网站有较多的静态页面,那么手工嵌入Tag需要的工作量和日后维护的工作量将是非常大的,而且如果某些静态页面在手工嵌入Tag时被遗漏,那么这些页面的访问统计将不会被传送至日志文件服务器,从而导致日志文件数据分析结果不准确。
对于动态页面,网站工程师将Tag代码做成公用模板,并在页面代码中的指定位置加入调用命令,这样,Web服务器上的动态应用程序在生成动态页面时便根据所述命令调用对应的公用模板,将Tag嵌入动态页面中;一般一个大型的网站会有很多动态应用程序,若要在所有的动态页面中嵌入Tag,就需要手工修改所有的动态应用程序,其工作量和日后维护的工作量也将是非常大的,而且网络工程师可能会忘记修改新上线的动态应用程序,使得新生成的动态页面中没有嵌入Tag,那么这些页面的访问统计将同样不会被传送至日志文件服务器,从而导致日志文件数据分析结果不准确。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴公司,未经阿里巴巴公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610127213.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改善网格网保护性能的方法
- 下一篇:一种隔空渗透给药方法