[发明专利]基于多平台、多供应商的搜索比价方法无效
申请号: | 201110122604.X | 申请日: | 2011-05-12 |
公开(公告)号: | CN102779133A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 吴志祥;张海龙;马和平;王专;吴剑;郭凤林;王晓钟;庞绍进 | 申请(专利权)人: | 苏州同程旅游网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 平台 供应商 搜索 比价 方法 | ||
1.基于多平台、多供应商的搜索比价方法,其特征在于:根据用户指定的商品信息,通过爬虫系统比较各个大型网站的价格信息,将各个网站的价格信息按照参考条件进行排序,或是用户指定排序的条件进行排序;之后,汇入数据库建立索引系统;当用户发出某个查询条件时,前台系统调用数据索引系统提供的数据查询接口进行数据查询,同时将用户查询的条件提交给爬虫系统进行抓取最新的数据;当用户看到搜索结果之后,通过点击单条结果既可引导至本价格原本所在的目标网站中,用户在目标网站上用户能看到该商品更为详细的相关信息。
2.根据权利要求1所述的基于多平台、多供应商的搜索比价方法,其特征在于:所述的爬虫系统采用基于数据抽取器的分布式系统结构;爬虫系统通过管理员提供的Web接口作为管理门户,实现的功能包括查看中心和子服务器的日志、设置添加主题、更新某个主题的URL种子、配置主题的抓取频率参量,控制爬虫状态。
3.根据权利要求1所述的基于多平台、多供应商的搜索比价方法,其特征在于:所述的爬虫系统采用主体中心节点模块和分布爬虫模块,完成主题操作、数据抽取、页面分析以及目标页面数据的存储;所述主体中心节点模块是控制中枢,包括有主题控制模块,所述主题控制模块的主输出端连接有URL控制器;所述主题控制模块的副输出端连接抽取器学习模块;所述的分布爬虫模块是爬取的具体实施者,包括URL控制器;所述URL控制器的主输入端连接有数据抽取器;所述数据抽取器的数据输入端连接有搜索控制器;所述的搜索控制器输入端设置有网页抓取器;所述网页抓取器的输出端设置有日志模块。
4.根据权利要求1所述的基于多平台、多供应商的搜索比价方法,其特征在于:所述的建立索引为采用Lucene建立索引,将倒转的索引存储在定制的文件格式中;所述文件格式被高度优化以确保能被搜索器快速的加载以及有效的搜索。
5.根据权利要求1所述的基于多平台、多供应商的搜索比价方法,其特征在于:所述的前台系统通过J2EE实现,对索引返回的搜索结果进行时间过滤,并通过ajax方式获取爬虫系统最新更新的价格数据,纠正更新索引中的数据,从而保证了数据的及时准确性。
6.根据权利要求1所述的基于多平台、多供应商的搜索比价方法,其特征在于:所述的照参考条件包括价格、网站信誉度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州同程旅游网络科技有限公司,未经苏州同程旅游网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110122604.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:驾驶健康多功能靠腰枕
- 下一篇:套接式手工具