[发明专利]基于查询重构图推荐高效用的搜索引擎查询方法在审

专利信息
申请号: 201410796485.X 申请日: 2014-12-18
公开(公告)号: CN105786817A 公开(公告)日: 2016-07-20
发明(设计)人: 王建国;黄哲学;姜青山 申请(专利权)人: 中国科学院深圳先进技术研究院
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 深圳市铭粤知识产权代理有限公司 44304 代理人: 孙伟峰
地址: 518055 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 查询 构图 推荐 效用 搜索引擎 方法
【权利要求书】:

1.一种基于查询重构图推荐高效用的搜索引擎查询方法,其特征在于,所 述方法包括:

S1、预测查询日志中查询q的重构查询q’;

S2、构建查询重构图G={Q,U,i,Eqr,Eqc,Eqi},其中,

Q={q1,q2,...,qn}表示查询日志中所有不同的查询;

U={u1,u2,...,un}表示查询日志中被用户点击的所有不同的URLs;

i表示中断顶点,每个查询q∈Q都有一条到i的边;

Eqr=((q,q′)[q∈Q,q′∈R(q))表示从查询到它们的重构查询的边,其中R(q)表 示查询q的重构集合;

Eqc={(q,u)|q∈Q,u∈C(q)}表示从查询到它们所点击的URLs的边,其中C(q) 表示查询q点击的URLs的集合;

Eqi={(q,i)|q∈Q}表示从查询到中断顶点i的边;

S3、使用查询重构图推荐高效用的查询,通过吸收态的随机游走获取URL 的效用,并推荐一组没有冗余搜索结果的查询。

2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:

S11、查询归一化;

S12、查询到关键词;

S13、关键词匹配。

3.根据权利要求2所述的方法,其特征在于,所述步骤S11具体为:

将查询中的大写字母改成小写字母,将连续的空格压缩为一个空格,删除 任何开头和结尾的空格。

4.根据权利要求2所述的方法,其特征在于,所述步骤S12具体为:

采用无监督的基于n元语法的方法来进行查询分割,对于一个查询 x={x1,...,xn]:

PMI(xi,xi+1)=logp(xi,xi+1)p(xi),p(xi+1),]]>

其中,p(xi,xi+1)是二元语法(xi,xi+1)出现的概率,p(xi)和p(xi+1)是单词xi和xi+1出 现的频率,当连续的两个单词的PMI值低于阈值0.895的时候,将这两个单词 分隔开。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410796485.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top