[发明专利]点击日志的生成方法及装置,搜索结果调整方法及装置在审
申请号: | 201110289117.2 | 申请日: | 2011-09-26 |
公开(公告)号: | CN103020087A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 金敬亭;乔敏 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击 日志 生成 方法 装置 搜索 结果 调整 | ||
1.一种点击日志生成方法,其特征在于,包括以下步骤:
分析待测页面,以获得所述待测页面的统一资源定位符URL;
通过所述待测页面的URL以获得所述待测页面所对应的超文本标记语言HTML源码;
在所述待测页面所对应的所述HTML源码中提取js函数调用,其中,所述js函数调用之中填充有所述待测页面中待测页面元素的URL、题目和标签;以及
在浏览器之中执行所述js函数调用以生成相应的点击日志。
2.如权利要求1所述的点击日志生成方法,其特征在于,还包括:
通过Selenium开源库打开所述待测页面,并通过Selenium开源库中的get_location函数获得所述待测页面所对应的URL。
3.如权利要求2所述的点击日志生成方法,其特征在于,所述通过Selenium开源库打开待测页面进一步包括:
通过所述Selenium开源库打开所述浏览器的默认页面;
通过所述Selenium开源库中的api:type函数在所述默认页面的输入框中输入一个或多个检索词;以及
通过所述Selenium开源库中的click函数进行点击确认以打开所述待测页面。
4.如权利要求3所述的点击日志生成方法,其特征在于,通过所述Selenium开源库中的run_script在所述浏览器中执行所述js函数调用。
5.如权利要求1所述的点击日志生成方法,其特征在于,通过lxml开源库解析所述待测页面所对应的URL以获得所述URL对应的HTML源码。
6.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括:
从所述HTML源码中获得所有css selector为a[onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第一列表;
遍历所述第一列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用;以及
将所述URL、题目和标签填充至所述js函数调用。
7.如权利要求1所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括:
根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表;
从所述第二列表中获得一个页面节点;
从所述页面节点对应的HTML源码的标签内部获得所有css selector为a[onmousedown]或者a[onclick]的待测页面元素,并将获得的所述待测页面元素添加至第三列表;
遍历所述第三列表之中的待测页面元素,提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用;
将所述URL、题目和标签填充至所述js函数调用;以及
在生成点击日志之后,继续从所述第二列表中获得其他页面节点并获得所述其他页面节点内待测页面元素的js函数调用。
8.如权利要求1-7任一项所述的点击日志生成方法,其特征在于,所述根据配置项从所述HTML源码中获得满足所述配置项的页面节点,并将所述页面节点添加至第二列表进一步包括:
通过所述Selenium开源库中的getElement函数从所述HTML源码中获得所有满足所述配置项中给定path或者给定css selector的页面节点,并将所述页面节点添加至所述第二列表。
9.如权利要求1-8任一项所述的点击日志生成方法,其特征在于,所述在待测页面所对应的所述HTML源码中提取js函数调用进一步包括:
从所述HTML源码中获得所有css selector为a[onmousedown]或者a[onclick]的待测页面元素,并将所述待测页面元素添加至第四列表;
遍历所述第四列表之中的待测页面元素,并提取每个待测页面元素的URL、题目和标签,并获取所述待测页面元素的js函数调用;
根据所述js函数调用获得所述待测页面元素的类型;
判断所述待测页面元素的类型是否与配置项中指定的fm_type相同;以及
如果判断相同,则将所述URL、题目和标签填充至所述js函数调用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110289117.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频播放次数统计方法
- 下一篇:一种氟维司群的新的制备方法