[发明专利]一种基于图像内容的标签自动化定义方法有效
申请号: | 201910496668.2 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110298386B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 谢海;赵冠杰;张帆 | 申请(专利权)人: | 成都积微物联集团股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/955;G06F16/9535;G06N3/04;G06F16/55 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 李龙 |
地址: | 610000 四川省成都市青白江区香岛大道*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 内容 标签 自动化 定义 方法 | ||
一种基于图像内容的标签自动化定义方法。本方法属于图像处理和自然语言处理领域,尤其涉及一种基于图像互信息分析的图像自动化标注方法。对现有技术中无法准确标注,错误的标注信息影响模型等问题,本发明的技术方案是:首先生成预训练模型,然后爬取互联网中的图片,将爬取的图片放入到生成的预训练模型中输出对应的标签,通过空间向量对预训练模型输出的标签进行评估,最后根据得到的新的数据更新模型和向量空间。可以根据网络数据进行自动更新模型,通过图像与图像之间的标注信息,相互学习,使其标注更加准确,特有的标签评估模块同时能够防止错误标注信息影响模型。
技术领域
本方法属于图像处理和自然语言处理领域,尤其涉及一种基于图像内容的标签自动化定义方法。
背景技术
图像标注通常是图像处理领域的一个具有现实价值的技术,它在图像检索,推荐系统中广泛使用,实用场景如以图搜图、广告精准定位、图片鉴黄和盗版检测等。传统方法通常提取图像本身信息用于图像标注,由于突进互联网图像爆炸式增长,无法对新图像、新信息进行标注。
目前,图像自动标注技术早期采用概率统计的方法,如在文献《Mori Y,TakahashiH,Oka R.Image-to-word transformation based on dividing and vector quantizingimages with words》中,MORI Y等提出建立图像与标签之间的概率分布,利用概率分布模型预测未知图像的标签。在文献《AMIRI S H,JAMZAD M.Efficient Multi-model Fusionon Supergraph for Scalable Image Annotation.Pattern Recognition》中,采用图算法,利用图像与图像之间的相似度关系构建图结构,利用图像与图像之间的权值确定标注内容。近几年来出现了一批以机器算法为核心的图像标注模型,SVM模型强大的分类能力使其出现了以下基于SVM的标注模型如:《CAO Y L,FAN J P,XUE X Y,et al.AutomaticImage Annotation by Incorporating Feature Hierarchy and Boosting to Scale upSVM》、《YANG C B,DONG M,HUA J.Region-Based Image Annotation Using AsymmetricalSupport Vector Machine-Based Multiple-Instance Learning》、《邱泽宇,方全,桑基稻,等.基于区域上下文感知的图像标注》,该模型将图像标注问题转变为分类问题,通过对每个图像进行分类,从而得到标注标签。
现有技术中,对于利用概率分布模型预测未知图像的标签,这类方法得到的概率分布很难表示图像与标签之间的分布关系,无法做到较高的准确率。对于利用图像与图像之间的相似度关系构建图结构,利用图像与图像之间的权值确定标注内容,这类方法图结构的构造复杂,随着数据增多而不再使用。对于机器算法为核心的图像标注模型,随着互联网图像数据爆炸式增长,图像类别标注也增长了很多,传统的机器学习方法也无法很好的进行处理。
发明内容
针对现有技术中无法准确标注,错误的标注信息影响模型的问题,本发明提供一种基于图像内容的标签自动化定义方法,其目的在于:能够根据网络数据进行自动更新模型,通过图像与图像之间的标注信息,相互学习,使其标注更加准确,特有的标签评估模块同时能够防止错误标注信息影响模型。
本发明采用的技术方案如下:
一种基于图像内容的标签自动化定义方法,包括以下器件:
图像预训练模块:图像分类模型的预训练,首先利用ImageNet数据集训练一个可以进行多分类的模型,该模型用于对图像进行多分类,但不一定适合于标签多分类。
数据爬取模块:负责图像、标签内容爬取并自动化下载,该数据将作为非完全模型承载体以及数据自动更新模块的重要输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都积微物联集团股份有限公司,未经成都积微物联集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910496668.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法