[发明专利]基于标注语义的个性化图像浏览与推荐方法及系统无效
申请号: | 201210074292.4 | 申请日: | 2012-03-20 |
公开(公告)号: | CN102663010A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 张玥杰;李杨;岑磊;金城;薛向阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标注 语义 个性化 图像 浏览 推荐 方法 系统 | ||
1.一种基于标注语义的个性化图像浏览与推荐方法,其特征在于具体步骤如下:
(1) 图像标注本体的构建,利用本体理论生成概念语义网络,构成本发明所需求的逻辑关联基础;
(2) 基于本体的语义扩展,基于所构建的图像标注本体——概念语义网络,对源语义进行关联扩展,从而扩展出符合逻辑的扩展语义;
(3) 基于扩展语义的图像检索,基于文本关键词的检索技术提供优化的查询结果,包含两个核心要素,即查询构成的设计和候选图像集的选择;
(4) 检索结果排序和推荐,在保证语义连贯和反映用户偏好的基础上,从图像检索的候选图像集中选择最优解返回给用户,其中包括三个核心算法:(a) 图模型构建算法,(b) 随机游走算法,及(c) 基于局部最优原则的推荐算法;
(5) 用户偏好建模,针对不同用户联想方式和偏好的不同,搜集用户的偏好信息,提供给不同用户个性化的推荐结果,用户模型主要作用于步骤(3)即图像检索和步骤(4)即检索结果排序和推荐。
2.根据权利要求1所述的方法,其特征在于所述的基于图像标注本体构建步骤中,建立一种健壮性很强的概念语义网络以供整个个性化图像浏览与推荐系统的语义扩展所使用,考虑标注的共现关系,通过以下公式计算两两概念在图像数据库中的共现概率:
(1)
其中,NCi与NCj分别表示以概念Ci和Cj标注的图像集合,该公式旨在统计以概念Ci和Cj标注的图像中,有多大比例的图像同时被两者标注;
整个本体的统计数据如下:1) 概念数:586个;2) 有效概念数:384个(在图像标注数据中出现200次以上的概念);3) 概念关系:6种;4) 上义概念:365个;5) 下义概念:365个;6) 兄弟概念:2,756个;7) 整体部分概念:48个;8) 反义概念:22个;9) 共现概念:1,829个;这里的概念数包括本体中的所有概念,而有效概念则是希望其在推荐系统中起作用的概念;之所以并非所有概念都“有效”,这是因为在构建本体时,为建立完整的is-a关系树,不仅包括从高频词汇和caltech256中经过搜集和筛选所得到的基本概念,还包括基本概念在WordNet中的上义概念;上义概念中的很多概念并不适合作为图像标注概念,因此根据所使用图像数据库的具体情况,仅将在数据库中出现200次以上的概念保留为有效概念;在来自WordNet的5种关系中,由is-a关系所衍生的3种关系出现比较频繁,因为is-a本身就是所使用的语言中最常见的语义关系;上义和下义关系出现次数相等,因为它们互为逆关系,总是成对出现;兄弟关系出现最多,由定义可知,这种关系随着is-a关系树的规模呈组合爆炸式增长;在本体中,只保留公共祖先结点在两层以内的兄弟结点;基于统计所得到的共现关系为本体中每对概念均提供一个关系值,则取每个概念关系值最大的5个概念,并去掉关系值过小的关系对。
3.根据权利要求2所述的方法,其特征在于所述的基于本体的语义扩步骤中,建立一种合理的扩展逻辑;所采用的语义扩展是将与源语义具有任何关系的语义都作为扩展语义,语义扩展的结果中只保留属于有效概念的语义;因此,上文统计语义关系时仅包括属于有效概念的部分,非有效概念的语义在语义扩展中不会得到结果;然而,在计算语义关系时,即使不是有效概念也不会被忽视;
对图像语义进行语义扩展时,先对图像标注中的语义根据is-a关系进行聚类,以避免重复的语义扩展结果;聚类方法是将每个图像标注在本体中能够匹配得到的语义作为结点,然后根据本体将由is-a关系的结点用一条边连接起来,最后将每个连通分支作为一个聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210074292.4/1.html,转载请声明来源钻瓜专利网。