[发明专利]基于图像与文字的无监督联合视觉概念学习系统及方法有效

申请号：	201610595620.3	申请日：	2016-07-26
公开（公告）号：	CN106227836B	公开（公告）日：	2020-07-14
发明（设计）人：	熊红凯;倪赛杰	申请（专利权）人：	上海交通大学
主分类号：	G06F16/58	分类号：	G06F16/58;G06K9/62
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	徐红银;郭国中
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于图像与文字的无监督联合视觉概念学习系统及方法，包括：文字解析模块，基数示例学习模块和多任务聚类模块，其中：所述文字解析模块利用社交媒体对图像的附加句子描述提取相应的名词作为视觉概念及其基数词作为下一模块的附加约束信息；所述基数示例学习模块利用基数引导的多示例学习方法来训练每个视觉概念的分类器；所述多任务聚类模块处理概念间的多样性，即将指代相似物体的名词聚集为一个大类作为视觉概念。本发明利用无监督的自动学习可以有效解决大规模数据下人工标定的实现繁复问题。
搜索关键词：	基于图像文字监督联合视觉概念学习系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于图像与文字的无监督联合视觉概念学习方法，其特征在于包括：文字解析步骤：对于给定的句子描述利用文字解析工具提取相应的名词，对句中的每个词进行词性标注并提取出单数和复数名词作为基数示例学习模块的标签；除了名词本身，还提取名词对应基数即数量作为基数示例学习的附加约束信息；基数示例学习步骤：首先提取句子描述所对应图像中的显著区域，再利用文字解析步骤中提取到的基数信息引导多示例学习的分类器训练每个视觉概念，即对每幅图像提取基数相应数量的物体个数来提高视觉概念学习的分类准确性，得到视觉概念分类器；该步骤训练所得的每个视觉概念分类器将作为文字解析步骤的输入；多任务聚类步骤：将基数示例学习步骤训练得到的视觉概念分类器利用多任务聚类将指代相似物体的名词聚集为一个大类作为视觉概念来处理概念间的多样性，以获得更加紧致和鲁棒的视觉概念。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610595620.3/，转载请声明来源钻瓜专利网。

上一篇：基于二分网络图层次聚类的团队研究方向挖掘方法
下一篇：一种数据分析方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于图像与文字的无监督联合视觉概念学习系统及方法有效

专利文献下载