[发明专利]用于构建用户模型的改进的GuTao法无效
申请号: | 201110361047.7 | 申请日: | 2011-11-15 |
公开(公告)号: | CN102495844A | 公开(公告)日: | 2012-06-13 |
发明(设计)人: | 许国艳;于天枢 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 艾中兰 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 构建 用户 模型 改进 gutao | ||
技术领域
本发明涉及一种改进的GuTao法,用于构建用户模型,属于个性化信息服务领域。
背景技术
个性化信息服务包括用户建模、项目匹配和个性化推荐输出三个部分。构建用户模型是个性化信息服务的基础。在个性化信息服务研究早期,用户建模技术并未得到重视。研究工作重点在于个性化信息服务的具体技术上,如用户聚类技术、推荐技术、信息检索技术等,用户建模技术只是这些研究中的附属。随着研究的深入,研究者逐渐意识到:个性化信息服务的质量不仅取决于具体的实现技术,还取决于用户兴趣和偏好的可计算描述,即构建用户模型的质量。
传统的用户模型构建方法主要是基于统计学的,采用主题词或加权的关键词向量等表示用户模型。通过对用户浏览记录、访问历史进行概率分析,获得用户的兴趣模型。这种方法理论成熟,使用相对简单,但存在缺乏语义、兴趣度粒度大的缺点。
随着语义技术地发展,本体作为概念化的模型,具有强大的语义扩展和推理能力。利用本体语义上的优势,将用户建模技术和本体结合起来构建基于本体的用户模型是用户建模技术的主要发展趋势。
发明内容
本发明基于本体构建用户模型,在具体的构建方法上提出了改进的GuTao法。GuTao法能够半自动的构建领域本体,自动生成形式背景并消除概念间的冗余,但存在着不能处理多值属性的缺陷。本发明提出了以兴趣度为权值,作为多种属性向单值属性转换的依据,解决了GuTao法不能处理多值属性的问题,实现了对GuTao法的改进。
本发明提出了将兴趣度作为多值属性向单值属性的转换依据,在基本兴趣度公式的基础上推导出复合的兴趣度公式。下面将介绍兴趣度的基本公式以及根据需要的推导的公式。
1.兴趣度的概念
兴趣度(Interestingness)是用来衡量用户对本体中的某概念的感兴趣程度的一个度量指标。它主要是面向用户模型的使用者的,用户的兴趣描述越具体,越有实际价值。
2.基本的兴趣度公式
兴趣度计算公式主要有以下三种:
(1)I(Ci):表示对于概念Ci感兴趣程度,形如公式1。
其中,time表示一个用户用于浏览一个给定网页的时间。length指网页的长度(如字节数等)。以r(d,Ci)表示网页与概念的匹配强度,该值是一个页面特征化过程的一个结果。
(2)Frequency(Ci):通过用户检索过程中与概念Ci相关的检索数Q(Ci)与检索总次数Q的比值来反映用户对概念的感兴趣程度。
其中Frequency(Ci)反映用户对本体中某个概念Ci的感兴趣程度。Q(Ci)是用户对概念Ci检索的次数,Q表示用户检索的总次数。
(3)Clarity(Ci):通过清晰度反映了用户提出的检索反映其自身兴趣的准确性,通常当用户对于自己要查询的事物越是不了解,他就越倾向于使用较为抽象的概念。具体公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110361047.7/2.html,转载请声明来源钻瓜专利网。