[发明专利]大数据查询推荐方法及其系统有效
申请号: | 201710303512.9 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107169821B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 姜可平;江有归;封雷;刘东升 | 申请(专利权)人: | 杭州泰一指尚科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535;G06F16/35 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨天娇 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 查询 推荐 方法 及其 系统 | ||
本发明公开了一种大数据查询推荐方法及其系统。其中,所述方法包括:通过用户查询请求的历史记录,构建用户查询反馈操作模型;输出与用户查询反馈操作对应的集合,所述集合的元素为权重最高的前K个主题词集合;根据所述主题词集合的权重,计算查询请求的主题词集合之间相似性的标准差;对所述历史记录中的用户查询请求的标准差进行聚类,形成若干个查询概念;获取用户查询请求并确定与所述用户查询请求匹配的所述查询概念;将匹配的查询概念的聚类中心以及与聚类中心距离最小的前K个查询推荐给用户。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种大数据查询推荐方法及其系统。
背景技术
大数据的分析和处理已经成为企业重要的IT能力。因为大数据的体量大、速度快、种类多,具有大量异构非结构化数据,使得大数据分析处理后的利用也存在巨大的困难。
传统数据分析的结果,可以很方便地通过查询这一服务得到利用,而在大数据的场景下,简单的查询目的会带来大量无关的结果,导致用户无法通过查询得到想要的结果。
造成上述大数据查询困难的主要原因在于用户很难精确的描述自己的查询目的,对于查询目的的限定或者陈述过于宽松,导致无法过滤出有效的查询结果。由于查询结果宽泛,导致用户在查询操作后依然要处理大量无关信息。因此,为了降低这些处理操作,和电子商务领域的平台商品推荐机制一样,在大数据的用户查询过程中,也可以使用推荐的方式,帮助用户快速筛选出有效的查询得到想要的结果。
常规的推荐系统,比如电子商务领域的商品推荐系统,会基于产品的内容或特性进行匹配和推荐。但由于大数据查询本身难以描述不具备实物商品的特性。因此,查询操作之间无进行商品匹配那样的对比。
虽然一些搜索引擎使用的查询推荐过程通常和时下流行的主题进行匹配,但大部分企业系统无法达到搜索引擎系统的运算能力,也无法得到除企业自身专注领域之外的数据,从而无法对流行主题进行提取。
企业的数据查询系统自身维护着大量查询日志(即查询的历史记录),用户在提交查询请求后,日志会记录对结果进行的反馈操作如点击、修改关键字等,如查询结果符合用户预期,则用户会采纳相应的资料。
相关的研究中,有的对比用户反馈操作正负性,但正负反馈的界定难以明确,且有些方法要配合相应的硬件设备,难以应用,也有的参照搜索引擎的做法,推测用户兴趣点,但搜索引擎的这一做法仅仅改善了用户对其界面的偏好和使用体验,并没有实现大数据查询过程中的有效推荐。
因此,现有技术还有待发展。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供大数据查询推荐方法及其系统,旨在解决现有技术中大数据查询过程中,推荐效果不佳的问题。
为了达到上述目的,本发明采取了以下技术方案:
一种大数据查询推荐方法,其中,所述方法包括:
通过用户查询请求的历史记录,构建用户查询反馈操作模型;
输出与用户查询反馈操作对应的集合,所述集合的元素为权重最高的前K个主题词集合;
根据所述主题词集合的权重,计算查询请求的主题词集合之间相似性的标准差;
对所述历史记录中的用户查询请求的标准差进行聚类,形成若干个查询概念;
获取用户查询请求并确定与所述用户查询请求匹配的所述查询概念;
将匹配的查询概念的聚类中心以及与聚类中心距离最小的前K个查询推荐给用户。
所述的方法,其中,所述构建用户查询反馈操作模型,具体包括:
将用户查询反馈操作划分为若干个队列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州泰一指尚科技有限公司,未经杭州泰一指尚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710303512.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置