[发明专利]通过对信息新颖性和动态学的分析来个性化新闻馈送的原理和方法无效

专利信息
申请号: 200810090700.9 申请日: 2005-03-02
公开(公告)号: CN101256591A 公开(公告)日: 2008-09-03
发明(设计)人: E·J·霍维兹;E·加布里洛维奇;S·T·杜梅斯 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海专利商标事务所有限公司 代理人: 陈炜
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 信息 新颖性 动态 分析 个性化 新闻 馈送 原理 方法
【权利要求书】:

1.一种创建个性化信息的方法,其特征在于,它包括:

自动分析来自不同信息源的文档;

自动确定所述文档的新颖性;以及

基于所述文档的新颖性创建个性化信息馈送。

2.如权利要求12所述的方法,其特征在于还包括通过为每个文档组建立一模型以推断文档组之间的差异,且随后用相似性度量来比较所述模型。

3.如权利要求2所述的方法,其特征在于,所述模型采用在字词特征上的修匀几率分布或在同一特征空间内的权重矢量。

4.如权利要求2所述的方法,其特征在于,相似性度量还包括KL发散、JS发散、矢量计算的余弦、特征权重矢量的余弦和对先前未见过的命名实体的密度衡量中的至少一种。

5.如权利要求4所述的方法,还包括提供一新颖性排序算法,该算法被迭代式地应用以产生一个读者可能会感兴趣的稿件小集。

6.如权利要求5所述的方法,还包括以下至少之一:提供一希望递增分析和将实际可用的更新与用户已阅的种子报道进行比较,选择与种子报道最不相似的稿件。

7.如权利要求6所述的方法,还包括下列算法:

算法RANKNEWSBYNOVELTY(dist,seed,D,n)

R←seed//initialization

for i=1 to min(n,|D|)do

dargmaxdiD{dist(di,R)}]]>

R←R∪{d};D←D/{d}

其中dist是距离度量,seed是种子报道,D是一组相关更新,n是所期望选择的更新数量,R是根据新颖性排序的稿件集。

8.如权利要求6所述的方法,还包括提供用户快报的效益对于成本的一般分析以基于用户的上下文考虑而用中断用户的代价平衡特定稿件或稿件组的信息价值。

9.如权利要求6所述的方法,还包括将在一个时期中收到稿件与定期收到的稿件集合进行比较。

10.如权利要求9所述的方法,还包括确定考虑了与主题相关的先前稿件但按时间减损其度量权重的距离度量。

11.如权利要求6所述的方法,还包括下列算法:

算法PICKDAILYUPDATE(dist,Bg,D,thresh)

dargmaxdiD{dist(di,Bg)}]]>

If dist(d,Bg)>thresh then display(d)

Bg ←D

其中dist是距离度量,Bg是背景参考集,包括在前一天收到的有关稿件的集合,D是在今天收到的一组新稿件,thresh是用户定义的敏感性阈值。

12.如权利要求6所述的方法,还包括确定新颖性的猝发。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810090700.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top