[发明专利]通过对信息新颖性和动态学的分析来个性化新闻馈送的原理和方法无效

专利信息
申请号: 200810090700.9 申请日: 2005-03-02
公开(公告)号: CN101256591A 公开(公告)日: 2008-09-03
发明(设计)人: E·J·霍维兹;E·加布里洛维奇;S·T·杜梅斯 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海专利商标事务所有限公司 代理人: 陈炜
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 信息 新颖性 动态 分析 个性化 新闻 馈送 原理 方法
【说明书】:

本申请是申请人于2005年3月2日提交的、申请号为“200510053185.3”的、发明名称为“通过对信息新颖性和动态学的分析来个性化新闻馈送的原理和方法”的发明专利申请的分案申请。

相关申请

本申请要求于2004年3月2日提交的序号为60/549,371、发明名称为“通过对新信息和动态学的分析来个性化新闻馈送的原理和方法(PRINCIPLESANDMETHODS FOR PERSONALIZEING NEWSFEEDS VIA AN ANALYSISOF INFORMATION DYNAMICS)”的美国临时专利申请的优先权,该专利申请整体引用在此作为参考。

(1)技术领域

本发明一般地涉及计算机系统,尤其涉及通过信息动态学(Dynamics)自动化分析来个性化诸如新闻之类的信息时间流的系统和方法。

(2)背景技术

就在十年以前,诸如新闻馈送(news feeds)的大规模信息流动被专门进行信息供应的组织所拥有、监控和过滤。万维网Web给所有有兴趣的用户带来了管理和吸取新闻馈送的挑战和机遇。识别“重要”信息成为了Web搜索和文本归纳概括的研究中一个基本的方面。搜索方法关注于最大程度满足用户亟需需求的文档集。归纳概括工作努力地将大数量的文本压缩成更加简洁的程式。在缺少与文本相关联的识别深层语义的自动化方法的情况下,以前的归纳概括工作一般是在完整句子的级别上操作,把最具有代表性的句子交织在一起以创建一篇摘要。对搜索和概括的研究一般忽视了情报内容随时间持续到达的动态学方面(Dynamics)。

(3)发明内容

以下是本发明的一个简要概括,以便提供对本发明中一些方面的基本理解。这个部分不是本发明的规范纵览。它并不是要确定出本发明中的重要/关键元素或者描绘其范围。它唯一的目的是用一种简化的形式给出本发明的一些概念,作为后续更详尽说明的序幕。

本发明提供了识别信息新颖性的系统和方法,以及这些方法如何被应用于管理随时间变化的信息内容的系统和方法。提供了一个一般框架用来比较文档集,借此框架可假定文档能按照它们的内容或来源来编组,并可分析出组间和组内的差异与共性。例如,将两组属于相同主题但得自不同来源的文档并列起来,诸如,在世界不同区域的对某一个事件的消息覆盖能揭示对情势的观点和总体阐述方面的差异。从静态文集过渡到随时间产生的稿件集,可以对内容的演化进行研究。例如,可以研究在一个时期就同一个故事形成的一系列新闻稿件,以期凸显真正有内容的信息更新并滤除大量的在很大程度重复“炒冷饭”的稿件。

可以搜集有关诸文档集中的词频(word occurence)的详细统计数据,以表征这些文档集之间的差异性和相似性。各种的字词模型可以通过提取表示人物、组织和地理位置的名称的命名实体来增强。由于缺少充足的统计数据,词组和搭配的区别性语义属性往往被胜出(outweighed),与此形成对比的是,命名实体识别那些相对固定的被许多作者在一个特定主题中以一种普遍的方式使用的记号(token),因此他们的使用贡献了相当数量的消息。例如,所提供的一种类型的分析用在其中发现的命名实体来表示这些稿件。分析可以关注于当前的新闻流或其它主题。当前新闻流形成对研究急切的挑战和机遇。新闻馈送涵盖大量的信息、给出丰富的想法和观点、也包含有丰富多彩形式和内容,从即时新闻的简短的最新消息、到故事展开的重要的摘要、再到单纯的对一再报到的“陈年旧事”的喋喋不休。

可以开发确定所追踪的故事的重要更新的算法,把用户们从必须详审一长串从不同的来源到达的相似稿件中解放出来。根据本发明所提供的方法提供了个性化新闻门户和新闻快报服务的基础,它们寻求对需要跟踪演化中的新闻报道的用户最大限度地减少时间和中断。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810090700.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top