[发明专利]一种图片标注词推荐方法及装置在审
申请号: | 201310503850.9 | 申请日: | 2013-10-23 |
公开(公告)号: | CN104572735A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 邓志鸿;张杰;梁馨月 | 申请(专利权)人: | 华为技术有限公司;北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 陈蕾;许伟群 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 标注 推荐 方法 装置 | ||
技术领域
本发明涉及数据处理领域,更具体的说,涉及图片标注词推荐方法及装置。
背景技术
随着社交网站的兴起和繁荣,人们越来越喜欢将自己生活中的点点滴滴记录在社交平台上,例如,在社交平台上上传自己拍摄的图片。
在用户上传图片之后,通常采用标注词标注上传图片,以便于用户对图片存储、归类和分享等操作。为了方便用户标注上传的图片,社交平台提供一个存储有大量标注词的数据库。在社交平台接收到用户上传的图片后,会将数据库中预先存储的所有标注词全部显示出来,以供用户选择适合的标注词。
在研究和实践过程中,发明人发现上述图片标注词推荐方法至少存在以下问题:
在用户每次上传图片后,社交平台都会将数据库中所有的标注词推荐给用户,其中,推荐的标注词包括很多与用户上传的图片无关的标注词,从而导致推荐给用户的标注词与用户上传的图片的匹配度极低。而且,数据库中标注词的种类繁多,每个种类下标注词的数量也非常庞大,所以用户在数据库中筛选适合于图片内容的标注词非常耗费时间。
发明内容
本发明的实施例提供一种图片标注词推荐方法及装置,以使推荐的标注词与图片内容的匹配度高,且节省用户筛选标注词的时间。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
第一方面,一种图片标注词推荐方法,包括:
获取客户端上传的待标注图片;
分别计算数据库中每张已标注图片与所述待标注图片的图像相似度;
选择与所述待标注图片的图像相似度大于第一阈值的已标注图片组成图片组;
提取所述图片组中每张所述已标注图片对应的标注词组成标注词组;
输出所述标注词组中的标注词作为所述待标注图片的标注词。
结合上述第一方面,在第一种可能的实现方式中,在所述提取所述图片组中已标注图片的标注词组成标注词组之后,在所述输出所述标注词组中的标注词作为所述待标注图片的标注词之前,还包括:
分别计算所述标注词组中的各标注词与知识库中各词语的语义相似度;
选择所述知识库中与所述标注词组中的标注词的语义相似度大于第二阈值的词语添加到所述标注词组中。
结合上述第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述输出所述标注词组中的标注词作为所述待标注图片的标注词,包括:
提取所述标注词组中各标注词对应的已标注图片的标注日期;
建立所述标注词组中各标注词与所述标注词对应的已标注图片的标注日期之间的对应关系;
按照所述标注日期顺序输出所述标注词组中的标注词作为所述待标注图片的标注词。
结合上述第一方面或第一方面的第一种可能的实现方式,在第三种可能的实现方式中,所述输出所述标注词组中的标注词作为所述待标注图片的标注词,包括:
提取所述标注词组中各标注词对应的已标注图片的拍摄地址;
提取所述待标注图片的拍摄地址;
计算所述标注词组中各标注词对应的已标注图片的拍摄地址与所述待标注图片的拍摄地址之间的距离;
建立所述标注词组中各标注词与所述标注词对应的已标注图片的拍摄地址和所述待标注图片的拍摄地址之间的距离的对应关系;
按照所述距离的大小顺序输出标注词组中的标注词作为待标注图片的标注词。
结合上述第一方面或第一方面的第一种可能的实现方式,在第四种可能的实现方式中,在所述输出所述标注词组中的标注词作为所述待标注图片的标注词中,包括:
统计数据库中包含所述标注词组中每个标注词的已标注图片的张数;
按照所述张数顺序输出所述标注词组中的标注词作为所述待标注图片的标注词。
结合上述第一方面或第一方面的第一种可能的实现方式,在第五种可能的实现方式中,在所述输出所述标注词组中的标注词作为所述待标注图片的标注词中,包括:
计算数据库中所述标注词组的每个标注词在预设时间段内的共现次数,所述共现次数为每个标注词与其它标注词共同描述一张所述已标注图片的次数;
按照所述共现次数顺序输出所述标注词组中的标注词作为所述待标注图片的标注词。
结合上述第一方面或第一方面的第一种可能的实现方式,在第六种可能的实现方式中,在所述输出所述标注词组中的标注词作为所述待标注图片的标注词中,包括:
判断所述标注词组中的标注词的数量是否大于第三阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学;,未经华为技术有限公司;北京大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310503850.9/2.html,转载请声明来源钻瓜专利网。