[发明专利]进行数据搜索的方法及搜索服务器有效
申请号: | 201310370878.X | 申请日: | 2013-08-23 |
公开(公告)号: | CN104424215B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 王顼;唐文宁;禹荣凌;岑植旺 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司11018 | 代理人: | 周华霞,王丽琴 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 数据 搜索 方法 服务器 | ||
技术领域
本发明涉及数据处理技术,尤其涉及进行数据搜索的方法及搜索服务器。
背景技术
现有技术中,进行数据搜索时,用户在搜索网页的查询栏中输入查询词,向搜索服务器发送包含查询词的查询请求,接收搜索服务器反馈关于查询词的搜索条目;之后,用户可点击搜索条目,以切换到该搜索条目对应的网页查询详细内容。
在用户输入查询词的过程中,搜索服务器会根据用户输入的过程信息反馈联想词,以显示在网页的智能提示栏中;用户可直接点击联想词,以作为查询词,发送给搜索服务器。并且,在显示搜索条目时,网页在相关搜索栏还会显示与查询词关联的相关搜索词,一般地,相关搜索栏置于网页下端。
举例进行说明,想要输入的查询词为ABC,当输入到AB时,即过程信息为AB,联想词里包括ABC、阿波罗、ABB等,这时可以直接选中ABC;进行查询之后,相关搜索栏中显示的相关搜索词包括智能ABC输入法、ABC儿歌等。
用户的搜索行为记录在搜索日志中,搜索服务器对搜索日志进行分析,来确定各查询词的联想词和相关搜索词。分析方法有多种,举例说明:对于查询词ABC,如果搜索日志中记录的以“ABC公司最好”为查询词进行查询的次数大于设定阈值,则将“ABC公司最好”作为ABC的联想词和相关搜索词,分别放入联想词库和相关搜索词库中。这里,将联想词和相关搜索词统称为提示词。
在实际运用中,存在采用机器操作频繁输入查询词,以增加某查询词的搜索次数,进而将其设置到联想词库和相关搜索词库中,以提高该查询词为用户点击的几率。这导致搜索时显示提示词的准确性较低。
目前,机器操作一般具有搜索频率较高的特点,例如为1分钟10次查询,因而,为了避免机器操作,常采用如下的解决方式:对用户关于某查询词的搜索频率进行判断,如果大于设定阈值,例如大于1分钟5次,则判断为机器操作,对其进行标记,不将其作为提示词。但该方式存在以下缺陷:如果机器操作时将搜索频率降低,例如为1分钟1次,则无法对其进行避免,仍为将其确定为提示词,导致搜索时显示提示词的准确性很低。
发明内容
本发明提供了一种进行数据搜索的方法,该方法能够提高数据搜索时显示提示词的准确性。
本发明提供了一种进行数据搜索的搜索服务器,该搜索服务器提高数据搜索时显示提示词的准确性。
一种进行数据搜索的方法,该方法包括:
从搜索日志中提取出设定时间段内的搜索记录;
从搜索记录中统计出对应查询词的特征参数,所述特征参数包括查询词被查询的总次数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv;
由查询词的特征参数确定查询词是否为异常查询词;
对异常查询词进行标记,以使异常查询词不用于后续的搜索处理。
一种进行数据搜索的搜索服务器,该搜索服务器包括搜索记录提取单元、特征参数统计单元、异常查询词确定单元和标记单元;
所述搜索记录提取单元,从搜索日志中提取出设定时间段内的搜索记录,发送给所述特征参数统计单元;
所述特征参数统计单元,从搜索记录中统计出对应查询词的特征参数,发送给所述异常查询词确定单元,所述特征参数包括查询词被查询的总次数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv;
所述异常查询词确定单元,由查询词的特征参数确定查询词是否为异常查询词;
所述标记单元,对异常查询词进行标记,以使异常查询词不用于后续的搜索处理。
从上述方案可以看出,本发明中,从搜索日志中提取出设定时间段内的搜索记录;对提取出的搜索记录进行分析,从搜索记录中统计出对应查询词的特征参数,所述特征参数包括查询词被查询的总次数Qv,查询词对应的查询前驱行为为空的查询次数NoReferQv;根据Qv、NoReferQv进行判断,确定出异常查询词;对异常查询词进行标记,以使联想词库和相关搜索词库中的异常查询词不用于后续的搜索处理。本发明基于查询词被查询的总次数Qv,查询词对应的查询前驱行为为空的查询次数NoReferQv,进行异常查询词的判断,而不采用基于搜索频率来确定异常查询词,这样,对于机器操作搜索频率较低的情况,可避免将其确定为提示词,从而,提高了数据搜索时显示提示词的准确性。
附图说明
图1为本发明进行数据搜索的方法示意性流程图;
图2为本发明进行数据搜索的方法流程图实例;
图3为本发明进行数据搜索的系统结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310370878.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗心脑血管硬化的药方
- 下一篇:用于LED灯的散热器及具有其的灯具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置