[发明专利]基于用户操作记录和资源内容的信息关联方法有效
申请号: | 201210345320.1 | 申请日: | 2012-09-17 |
公开(公告)号: | CN102915335A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 杨智强;殷钊;王衡;汪国平 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 操作 记录 资源 内容 信息 关联 方法 | ||
技术领域
本发明涉及操作系统环境下基于用户操作记录和资源内容的信息关联方法,属于计算机软件技术领域。
背景技术
当今用户的个人信息量越来越大,过量的信息会使人们产生浪费时间、延迟决策、无法专注于主要任务和压力等问题,可参见参考文件Waddington,P.(1997).Dying for Information?A report on the effects of information overload in the UK and worldwide.Reuters.1997。知识工作者,比如教授、律师和工程师等职业的人,对于信息过载的情况感受最为深刻,因为他们在日常工作中需要进行各种不同的任务,而进行任务的过程中需要查找和处理大量的信息。这就不可避免的产生了一个问题,在任务被打断或者任务切换的时候,要为获得当前任务的相关信息或者资源付出大量的精力。
信息的雪崩式增长的现状,以及目前的操作系统没有提供针对用户需要的信息管理方式,使得个人用户无法有效获取和管理个人信息的问题变得十分突出。个人信息管理就是关于如何帮助人们解决这个问题的研究领域。为用户提供完美的个人信息管理会遇到很多心理学上的挑战。这些挑战可以归结为以下的两点:一,要把物品(比如文件)进行分类在认知上是非常困难的。二,用户能够记住的关于物品的细节常常不能够用于检索。当前的研究从解决这两个挑战的角度提出了许多解决方案。
为用户提供更好的信息组织和呈现方式是个人信息管理的重要研究方向。Ofer Bergman等人所实现的项目文件夹,可以文献Ofer Bergman,Ruth Beyth-Marom,Rafi Nachmias,The Project Fragmentation Problem in Personal Information Management,CHI 2006Proceedings,2006为参考,将用户的所有同主题信息(包括文档、邮件、收藏的页面等)存储于同一文件夹下,用户可以在同一目录下存储和找回同主题信息。
除了更好地对信息进行组织和呈现之外,更强大的信息检索功能也是实现个人信息管理的重要手段。Dumais等人实现了一个StuffI’ve Seen(SIS)系统,具体实现方法,参考Dumais,S.T.,Cutrell,E.,Cadiz,J.J.,Jancke,G.,Sarin,R.and Robbins,D.C.(2003).Stuff I've Seen:A system for personal information retrieval and re-use.In Proc.SIGIR2003,72-79.。SIS的设计有两个关键的方面。一个方面是为不同组织结构的信息提供统一的标记,从而利用统一的标记实现统一的检索。另一个方面是利用比如浏览的时间、文件的作者等用户比较容易记住的上下文信息为用户提供检索。
信息组织和呈现的方式需要用户预先把资源进行分类,未能从根本上把用户从繁重的交互负担中解脱出来。信息检索的方式在一定程度中减小用户查找资源的开销,但是频繁检索会使得用户的任务产生中断,不能集中精力于当前的工作。
基于用户操作记录和资源内容的信息关联方法,可以为计算机用户提供一种实时而准确的资源推荐服务,解决上述存在的问题。
发明内容
本发明的目的在于提出一种资源信息关联方法。本发明主要应用在个人计算机中,根据用户过去的操作记录和访问过的资源内容,在用户查找资源之前向用户推荐相关信息,为用户节省查找信息的时间开销。
为达成上述目的,本发明的技术方案是:基于用户操作记录和资源内容的信息关联方法,其步骤包括:
1)监听用户在计算机中多个操作事件,获取资源内容和操作记录并储存于本地或远程数据库;
2)将所述操作记录转化为特定格式向量,建立基于操作记录的任务模型;
2-1)对所述操作记录进行时间片序列切分和向量转化;
2-2)根据隐式狄利克雷分配模型以所述操作事件为数据,同时以所述时间片为单元,建立任务模型;
3)根据所述资源内容建立基于资源内容的主题模型;
3-1)根据所述资源内容中提取的单词集合和词汇表,将每个资源的内容转换为词频向量表示;
3-2)将所述词频向量通过隐式狄利克雷分配模型表示,建立主题模型;
4)分别计算当前资源与其他资源所述主题模型和任务模型的关联程度,完成信息关联的处理并选择关联度最高的资源返回用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210345320.1/2.html,转载请声明来源钻瓜专利网。