[发明专利]基于查询重构图推荐高效用的搜索引擎查询方法在审
申请号: | 201410796485.X | 申请日: | 2014-12-18 |
公开(公告)号: | CN105786817A | 公开(公告)日: | 2016-07-20 |
发明(设计)人: | 王建国;黄哲学;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 查询 构图 推荐 效用 搜索引擎 方法 | ||
1.一种基于查询重构图推荐高效用的搜索引擎查询方法,其特征在于,所 述方法包括:
S1、预测查询日志中查询q的重构查询q’;
S2、构建查询重构图G={Q,U,i,Eqr,Eqc,Eqi},其中,
Q={q1,q2,...,qn}表示查询日志中所有不同的查询;
U={u1,u2,...,un}表示查询日志中被用户点击的所有不同的URLs;
i表示中断顶点,每个查询q∈Q都有一条到i的边;
Eqr=((q,q′)[q∈Q,q′∈R(q))表示从查询到它们的重构查询的边,其中R(q)表 示查询q的重构集合;
Eqc={(q,u)|q∈Q,u∈C(q)}表示从查询到它们所点击的URLs的边,其中C(q) 表示查询q点击的URLs的集合;
Eqi={(q,i)|q∈Q}表示从查询到中断顶点i的边;
S3、使用查询重构图推荐高效用的查询,通过吸收态的随机游走获取URL 的效用,并推荐一组没有冗余搜索结果的查询。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:
S11、查询归一化;
S12、查询到关键词;
S13、关键词匹配。
3.根据权利要求2所述的方法,其特征在于,所述步骤S11具体为:
将查询中的大写字母改成小写字母,将连续的空格压缩为一个空格,删除 任何开头和结尾的空格。
4.根据权利要求2所述的方法,其特征在于,所述步骤S12具体为:
采用无监督的基于n元语法的方法来进行查询分割,对于一个查询 x={x1,...,xn]:
其中,p(xi,xi+1)是二元语法(xi,xi+1)出现的概率,p(xi)和p(xi+1)是单词xi和xi+1出 现的频率,当连续的两个单词的PMI值低于阈值0.895的时候,将这两个单词 分隔开。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410796485.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风险识别的方法及装置
- 下一篇:电子博物馆