[发明专利]基于图像与文字的无监督联合视觉概念学习系统及方法有效
申请号: | 201610595620.3 | 申请日: | 2016-07-26 |
公开(公告)号: | CN106227836B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 熊红凯;倪赛杰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 徐红银;郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于图像与文字的无监督联合视觉概念学习系统及方法,包括:文字解析模块,基数示例学习模块和多任务聚类模块,其中:所述文字解析模块利用社交媒体对图像的附加句子描述提取相应的名词作为视觉概念及其基数词作为下一模块的附加约束信息;所述基数示例学习模块利用基数引导的多示例学习方法来训练每个视觉概念的分类器;所述多任务聚类模块处理概念间的多样性,即将指代相似物体的名词聚集为一个大类作为视觉概念。本发明利用无监督的自动学习可以有效解决大规模数据下人工标定的实现繁复问题。 | ||
搜索关键词: | 基于 图像 文字 监督 联合 视觉 概念 学习 系统 方法 | ||
【主权项】:
一种基于图像与文字的无监督联合视觉概念学习方法,其特征在于包括:文字解析步骤:对于给定的句子描述利用文字解析工具提取相应的名词,对句中的每个词进行词性标注并提取出单数和复数名词作为基数示例学习模块的标签;除了名词本身,还提取名词对应基数即数量作为基数示例学习的附加约束信息;基数示例学习步骤:首先提取句子描述所对应图像中的显著区域,再利用文字解析步骤中提取到的基数信息引导多示例学习的分类器训练每个视觉概念,即对每幅图像提取基数相应数量的物体个数来提高视觉概念学习的分类准确性,得到视觉概念分类器;该步骤训练所得的每个视觉概念分类器将作为文字解析步骤的输入;多任务聚类步骤:将基数示例学习步骤训练得到的视觉概念分类器利用多任务聚类将指代相似物体的名词聚集为一个大类作为视觉概念来处理概念间的多样性,以获得更加紧致和鲁棒的视觉概念。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610595620.3/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序