[发明专利]使用语义距离学习的自动图像注释无效

申请号：	200980131706.9	申请日：	2009-06-11
公开（公告）号：	CN102119389A	公开（公告）日：	2011-07-06
发明（设计）人：	T·梅;X-S·华;S·李;Y·王	申请（专利权）人：	微软公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	上海专利商标事务所有限公司 31100	代理人：	顾嘉运
地址：	美国华***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用语义距离学习自动图像注释
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用来自动地注释新图像的计算机实现的过程，包括使用计算设备来执行以下过程动作：

输入训练图像集其中所述新图像不在中；

用关键字注释向量手动地注释中的每一训练图像；

将划分成多个训练图像语义聚类其中k是唯一地标识每一聚类的变量，包括语义上相似的训练图像，且将每一训练图像划分到单个聚类中；

对每一训练图像语义聚类

学习的语义距离函数(SDF)f^(k)，

利用f^(k)来计算所述新图像和中的每一训练图像之间的成对基于特征的语义距离分数，以产生的成对基于特征的语义距离分数集，其中所述集合中的每一基于特征的分数指定对所述新图像和中的特定训练图像之间的直观语义距离的度量，

利用的所述成对基于特征的语义距离分数集来生成的排序列表，其中所述列表根据中的每一训练图像与所述新图像的直观语义距离来对中的该训练图像进行排序，

估算的聚类关联概率p(k)，其中p(k)指定所述新图像在语义上与相关联的概率，并且

将中的每一训练图像的所述关键字注释向量概率性地传播至所述新图像，以产生所述新图像的聚类专用概率性注释向量w^(k)；以及

利用所有训练图像语义聚类的p(k)和w^(k)来生成所述新图像的最终关键字注释向量w。

2.如权利要求1所述的过程，其特征在于，

每一训练图像的所述关键字注释向量充当所述图像的元数据标签，所述向量包括一个或多个文本关键字，其中，

从规定的关键字词汇表提取所述关键字，并且

每一关键字描述所述图像中的不同的低级视觉特征。

3.如权利要求2所述的过程，其特征在于，所述规定的关键字词汇表包括Corel关键字数据库。

4.如权利要求2所述的过程，其特征在于，每一训练图像的所述关键字注释向量包括一个到五个之间的不同的关键字。

5.如权利要求1所述的过程，其特征在于，每一训练图像的语义被假定为由所述图像的所述关键字注释向量表示，且所述将划分成多个训练图像语义聚类的过程动作包括以下动作：

计算中的训练图像的每一可能对之间的成对基于注释的语义距离分数SD()，其中每一分数SD()指定对中的训练图像的特定对之间的直观语义距离的度量；以及

利用所述分数SD()来将中的训练图像划分成H个不同的训练图像语义聚类

6.如权利要求5所述的过程，其特征在于，中的训练图像的特定对的所述成对基于注释的语义距离分数SD()由等式给出，其中，

a是所述对中的一个图像的关键字注释向量，n₁是a中的关键字的总数，且a_i是a中的特定关键字，并且

b是所述对中的另一图像的关键字注释向量，n₂是b中的关键字的总数，且b_j是b中的特定关键字。

7.如权利要求6所述的过程，其特征在于，

采用Jiang和Conrath(JCN)关键字相似性度量JCN()来计算SD(a_i，b_j)，并且

SD(a_i，b_j)由以下等式给出：

8.如权利要求5所述的过程，其特征在于，所述利用所述分数SD()来将中的训练图像划分成H个不同的训练图像语义聚类的过程动作包括以下动作：

利用恒定移位嵌入架构来将中的训练图像嵌入到欧几里得向量空间中；以及

基于所述分数SD()，利用x-means算法来将所嵌入的训练图像分组成H个不同的训练图像语义聚类其中所述x-means算法自动地确定H的最优值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于微软公司，未经微软公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200980131706.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载