[发明专利]使用弱监督数据自动生成图像字幕的方法和系统有效

申请号：	201610995334.6	申请日：	2016-11-11
公开（公告）号：	CN106973244B	公开（公告）日：	2021-04-20
发明（设计）人：	王兆闻;尤全增;金海琳;方晨	申请（专利权）人：	奥多比公司
主分类号：	H04N5/278	分类号：	H04N5/278;H04N21/431;H04N21/488;G06N3/08;G06N3/04
代理公司：	北京市金杜律师事务所 11256	代理人：	酆迅
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明的各实施例总体上涉及使用弱监督为图像配字幕。具体地，本文中描述了用于使用弱监督为图像配字幕的技术。在实现中，获取关于目标图像的弱监督数据并且使用其提供补充被获得用于图像配字幕的全局图像概念的细节信息。弱监督数据是指没有被紧密地监管并且可能包括误差的噪声数据。给定目标图像，可以从弱注释的图像的源、诸如在线社交网络采集在视觉上相似的图像的弱监督数据。通常，在线发布的图像包括由用户添加的标签、标题、标注和短描述形式的“弱”注释。通过提取在不同源中发现的在视觉上相似的图像的关键词来生成目标图像的弱监督数据。然后在图像配字幕分析期间采用弱监督数据中包括的关键词来调制被应用于概率分类的权重。
搜索关键词：	使用监督数据自动生成图像字幕方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

在使用一个或多个计算设备促进图像采集管理的数字媒体环境中，一种用于使用弱监督数据自动生成图像字幕的方法，所述方法包括：获取用于字幕分析的目标图像；向所述目标图像应用特征提取以生成对应于所述图像的全局概念；将所述目标图像与来自弱注释图像的源的图像相比较以标识在视觉上相似的图像；通过从所述在视觉上相似的图像中提取用于指示图像细节的所述目标图像的关键词来构建所述关键词的集合；以及供应指示图像细节的所述关键词的集合作为所述弱监督数据用于连同所述全局概念进行字幕生成。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于奥多比公司，未经奥多比公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610995334.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N5-00 电视系统的零部件
H04N5-04 .同步
H04N5-14 .视频图像信号电路
H04N5-222 .电视演播室线路；电视演播室装置；电视演播室设备
H04N5-30 .转变光或模拟信息为电信号
H04N5-38 .发射机电路

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用弱监督数据自动生成图像字幕的方法和系统有效

专利文献下载