[发明专利]基于用户兴趣向量的个性化网页搜索排序方法无效
申请号: | 201210562728.4 | 申请日: | 2012-12-24 |
公开(公告)号: | CN103049528A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 张健;徐晓莉;胡亮;齐林;张小栓;冯飞;邢晓辉;魏宗洋;王楠;甘露;刘菁 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 兴趣 向量 个性化 网页 搜索 排序 方法 | ||
技术领域
本发明涉及信息检索、数据挖掘以及人工智能领域,是一种基于用户兴趣向量的个性化网页搜索排序方法。
背景技术
随着网络技术的发展,互联网上的信息成指数级增长。海量的信息使用户发现和获取信息变得非常困难。目前,很多网页搜索引擎主要是通过用户点击数据、历史网站、网络地址等比较容易获得但不易于发掘用户个性化特征的信息来对不同用户实现个性化的搜索结果。为了解决不同用户间的查询差异,本文提出一种新的网页推荐方法,即对特定领域用户进行问卷调查,再将提取的问卷调查信息和用户历史点击信息相结合,建立用户个性化的兴趣向量,基于用户个性化的兴趣向量生成更贴近用户兴趣的网页搜索排序结果。
发明内容
[0001]本发明的目的是克服现有技术的不足,提供基于用户兴趣向量的个性化网页搜索排序方法。
[0002]1.一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于包括以下步骤:
1)对指定用户进行问卷调查,提取用户兴趣主题;
2)捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表;
3)根据用户的页面一主题关系表,进一步推测出用户兴趣向量;
4)依据用户兴趣向量和用户查询,生成个性化网页搜索排序结果。
2.根据权利要求1所述的一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于所述的对指定用户进行问卷调查,提取用户兴趣主题步骤为:
a)面向特定用户,对其进行问卷调查,以分析其兴趣;
b)分析问卷调查结果,提取用户兴趣主题x。
3.根据权利要求1所述的一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于所述的捕捉用户的点击历史信息如何同其兴趣相关,并结合问卷调查结果,构造一个页面-主题关系表步骤为:
c)根据用户历史点击信息,提取用户兴趣主题y,并结合问卷调查结果生成比较全面的用户兴趣主题t,t=x+y;
d)通过查询预处理,计算链接到页面pj(j=1,…,n)的页面集合Lp,Lp中页面p0的外出链接集合lp0用户跟随lp0的概率d,计算与t相关的页面集合nt;
e)计算页面-主题关联矩阵Rpt(Rpt为一m×n矩阵),其行元素即为与ti(i=1,…,m)相关的页面偏置随机跳转概率向量Eti(p)=[Et(1),…,Et(n)]的各元素值,如下所示:
其中各元素的计算式为:
这里p=p1,…,pn,代表n个不同页面,t=t1,…,tm,代表m个不同的主题。
4.根据权利要求1所述的一种基于用户兴趣向量的个性化网页搜索排序方法,其特征在于所述的根据用户的页面-主题关系表,进一步推测出用户兴趣向量步骤为:
f)假设用户已访问k个页面,pi指第i个访问页面,则
为在TDSM下具有兴趣向量T的用户访问页面p的概率。所述TDSM即主题驱动搜索模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210562728.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种香酥栗子仁的制作方法
- 下一篇:红糟酸豆角的制备方法