[发明专利]搜索数据排序的方法和装置,数据搜索的方法和装置有效
申请号: | 201210572391.5 | 申请日: | 2012-12-25 |
公开(公告)号: | CN103902549B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 宋华青 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 数据 排序 方法 装置 | ||
技术领域
本申请涉及网络数据搜索的技术领域,特别是涉及一种搜索数据排序的方法,一种搜索数据排序的装置,一种数据搜索的方法,以及,一种数据搜索的装置。
背景技术
现有技术中,对于网络数据的搜索通常基于搜索引擎实现。
搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。
搜索引擎的工作原理大致可以分为:
(1)搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(Spider)的自动搜索机器人程序根据网页中的超链接,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。
(2)整理信息:搜索引擎整理信息的过程称为“创建索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。
(3)接受查询:用户向搜索引擎发起查询,搜索引擎接受查询并向用户返回搜索结果。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发起的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的搜索结果,并返回给用户。目前,搜索引擎返回结果主要是以网页链接的形式提供的,这样通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
现有技术中的搜索引擎往往需要用户首先提交搜索条件发起查询,如输入关键词,设定搜索范围等,而搜索引擎所返回的搜索结果仅仅是网络蜘蛛抓取到的数据库中的网页链接,完全无法兼顾用户的个性化需求。
目前,某些站内搜索引擎提供了一些个性化搜索的功能,如某些电子商务网站的产品搜索引擎或商品搜索引擎,会根据用户行为,商品,销量等多维度的信息,在用户不提交搜索条件的情况下,自动推荐可能适合用户需求的搜索结果。然而,这种现有方案中各种维度设置得比较多,而且不透明,多种维度间的权重设置也无法调整,往往不能实实在在满足用户的真实需求。在这种情况下,用户不得不重新提交搜索条件触发搜索引擎重新发起搜索,才能获得其想要的搜索结果。
显然,采用现有的搜索技术不仅无法充分满足用户的个性化需求,而且使用户操作繁琐,并且耗费了过多的客户端与服务器的资源,搜索效率低下。
因此,本领域技术人员迫切需要解决的问题是:提供一种搜索数据排序以及数据搜索的机制,用以在充分满足用户的个性化需求,简化用户操作,降低客户端与服务器资源耗费的基础上,提高搜索效率。
发明内容
本申请所要解决的技术问题是提供一种搜索数据排序以及数据搜索的方法,用以在简化用户操作,降低客户端与服务器资源耗费的基础上,提高搜索效率。
相应的,本申请还提供了一种搜索数据排序以及数据搜索的装置,用以保证上述方法在实际中的应用。
为了解决上述问题,本申请公开了一种搜索数据排序的方法,包括:
生成中庸需求点的数据;所述中庸需求点的数据包括搜索目标的参考属性值;
根据所述中庸需求点的数据,对相应搜索目标的数据集合进行排序,具体包括:
获取所述搜索目标的数据集合,并获取所述数据集合中一个或多个搜索目标的当前属性值;
计算所述一个或多个搜索目标的当前属性值与参考属性值的距离;
按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。
优选地,所述生成中庸需求点的数据的步骤包括:
获得包含一个或多个所述搜索目标的历史搜索结果,提取所述一个或多个搜索目标的历史属性值及历史搜索排序权值;
依据所述一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心,将所述质心作为搜索目标的参考属性值。
优选地,采用如下公式计算质心:
其中,k为搜索目标的个数,m为搜索目标的历史搜索排序权值,Xi为搜索目标的历史属性值。
优选地,所述包含一个或多个所述搜索目标的历史搜索结果包括,多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210572391.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:舍外换气式育雏加热炉
- 下一篇:数据库查询方法和装置及数据库系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置