[发明专利]基于图片内容的用户兴趣提取方法无效
申请号: | 201310164663.2 | 申请日: | 2013-05-07 |
公开(公告)号: | CN103268330A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 操晓春;周成举;张仁宇 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 内容 用户 兴趣 提取 方法 | ||
1.一种基于图片内容的用户兴趣提取方法,预先建立图片数据库,数据库中的每张图片都设置有表示其相关兴趣的标注信息,其特征在于,该方法包括以下步骤:
步骤一、建立兴趣树,该树结构中包括根节点以及表示用户兴趣的子节点;
步骤二、对用户的每一张图片进行图像检索,该步骤具体操作为:
步骤(101)、提取图片的Hessian-Affine区域;
步骤(102)、提取Hessian-Affine区域的图像特征点的SIFT特征值;
步骤(103)、对图像特征点进行聚类得到视觉关键字,并计算该视觉关键字的汉明码,图片的每一个视觉关键字转化成一个64维汉明码用于检索;
步骤(104)、通过视觉关键字,根据词袋模型,在图片数据库中检索匹配的图片;
步骤(105)、将所有匹配的图片进行打分,并按照得分的高低进行排序并显示,其中每张图片都有表示其语义内容的标注,这里的标注就是相对应的兴趣单词的ID,将图片的得分和其标注进行存储;
步骤三:用户兴趣挖掘,根据步骤二得到的数据,对其按照得分进行归一化计算:
其中Si为得分排序为第i名的图片的得分,n为检索出的图片的数量;对得到的数据再次进行打分:
Si=Si+1/2i+num/2i,
其中i为图片按照得分的排序位置,num为前i张图片中与第i张图片有相同标注的图片的数量;实现根据用户的兴趣分布对步骤二得到的数据进行处理;
步骤四、对具有相同标注的分数进行合并,按照合并后分数的高低进行排序,根据合并后分数的高低,对每一个标注与兴趣书中的兴趣进行比较,根据其离根节点的距离判定其相对应的兴趣,并把兴趣相同的分数合并,按照分数的高低进行排序,这样就根据一张图片得到了用户的兴趣分布;
重复以上步骤一至步骤四,对相册中所有图片得到的兴趣按照兴趣的类别进行合并,按照合并后的分数的高低进行排序和统计,从而得到该用户的兴趣分布。
2.如权利要求1所述的基于图片内容的用户兴趣提取方法,其特征在于,该方法还包括以下步骤:
利用以上步骤得到多位用户的兴趣分布,并将其存储下来;根据每位用户的兴趣分布,把拥有相同或相似兴趣的用户归为一个小组,每一个用户会有多个兴趣,这样每个用户会分到多个兴趣小组里,实现了通过用户相册得到的兴趣对用户的划分,从而得到兴趣小组分类。
3.如权利要求1所述的基于图片内容的用户兴趣提取方法,其特征在于,所述兴趣树的根节点不表示任何兴趣,只作为一个已知节点存在,二级节点代表泛化的兴趣,其子节点表示更具体的兴趣,以此类推,节点所在的层级越深,其表示的兴趣表示就越具体。
4.如权利要求1所述的基于图片内容的用户兴趣提取方法,其特征在于,所述步骤(103)中的倒排索引中的视觉关键字的距离定义为两个64维汉明码之间的不同的位数的个数,超出一定阈值就认为不匹配。
5.如权利要求1所述的基于图片内容的用户兴趣提取方法,其特征在于,所述步骤(103)中64维汉明码的生成过程如下,
生成随机正定矩阵,维数为128*64;
对于属于同一视觉关键字的特征,通过随机正定矩阵映射为64维特征;
计算生成的64维特征集合每一维上的中值;
对于图像的64维特征,若大于等于该维的中值,则对应位设为1,否则置为0,由此得到64维汉明码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310164663.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自动登录方法及装置
- 下一篇:二维码的验证方法及搜索引擎服务器
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法