[发明专利]基于图片内容的用户兴趣提取方法无效
申请号: | 201310164663.2 | 申请日: | 2013-05-07 |
公开(公告)号: | CN103268330A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 操晓春;周成举;张仁宇 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图片 内容 用户 兴趣 提取 方法 | ||
技术领域
本发明涉及图像数据挖掘技术领域,特别是涉及一种基于用户图片内容的图像检索技术领域和图像的语义内容理解领域。
背景技术
随着数码设备、智能手机等数字成像设备的普及,人们使用这些设备拍摄了数量庞大的图片。世界上最大的社交网站Facebook至今已经存储了2400亿张用户的数码照片,并且这个数量正在以每天3亿张的速度增加。国内最大的社交平台QQ空间的照片上传总数也已经突破1500亿张,其中日上传照片量最高值已突破3.6亿张。特别是移动互联网的快速发展,基于应用的照片上传也出现巨大的增长。图片分享应用程序Instagram的照片数量已经达到了50亿张,并且以每天500万张的速度增加。伴随大数据时代的到来,数据已经被人称之为另一种“石油”,尤其是图片比普通的文本数据蕴含着更多、更丰富的信息。但是由于图片本身数据量比较大且含有许多高层的语义信息,对于如何从图片中提取有价值的信息一直是一个难点。但是随着图像处理技术的不断进步,如何从图片中挖掘出潜在的有价值的信息受到越来越多的关注,现有的方法参见先前专利文献[1]和[2]。为了更好的挖掘出这些数量庞大的照片所蕴含的有价值的信息,本专利提出了一种基于用户图片的用户兴趣的挖掘与分类方法。
先前专利文献信息参考如下:
[1]Enhancedidentificationofinterestingpoints-of-interest(GOOGLEINC[US])文献号US8239130公开号:US8239130B1公开日2012-08-07状态:有权
[2]SystemsandMethodsforImagingaVolume-of-Interest(LANDMARK GRAPHICSCORPAHALLI[US])文献号US2009027385公开号:US2009027385A1公开日2009-01-29状态:有权
发明内容
基于现有技术中存在的问题,本发明提出一种基于图片内容的用户兴趣提取方法,利用改进的图像检索方法,高效地实现了基于图片内容的兴趣分布信息的提取。
本发明提出了一种基于图片内容的用户兴趣提取方法,预先建立图片数据库,数据库中的每张图片都设置有表示其相关兴趣的标注信息,该方法包括以下步骤:
步骤一、建立兴趣树,该树结构中包括根节点以及表示用户兴趣的子节点;
步骤二、进行图像检索,该步骤具体操作为:
步骤101、提取图片的Hessian-Affine区域;
步骤102、提取Hessian-Affine区域的图像特征点的SIFT特征值;
步骤103、对图像特征点进行聚类得到视觉关键字,并计算该视觉关键字的汉明码,图片的每一个视觉关键字转化成一个64维汉明码用于检索;
步骤104、通过视觉关键字,根据bagofwords模型(词袋模型),在图片数据库中检索匹配的图片;
步骤105、将所有匹配的图片进行打分,并按照得分的高低进行排序并显示,其中每张图片都进行表示其语义内容的标注,这里的标注就是相对应的单词的ID,将图片的得分和其标注进行存储;
步骤三:用户兴趣挖掘,根据步骤二得到的数据,对其按照得分进行归一化计算:
其中Si为得分排序为第i名的图片的得分,n为检索出的图片的数量;
对得到的数据再次进行打分:
Si=Si+1/2i+num/2i,
其中i为图片按照得分的排序位置,num为前i张图片中与第i张图片有相同标注的图片的数量;实现根据用户的兴趣分布对步骤二得到的数据进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310164663.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动登录方法及装置
- 下一篇:二维码的验证方法及搜索引擎服务器
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法