[发明专利]一种基于深度贝叶斯学习的图像标记估计方法在审
申请号: | 202010734902.3 | 申请日: | 2020-07-28 |
公开(公告)号: | CN112001422A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 李绍园;侍野 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/36;G06K9/46 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李淑静 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 贝叶斯 学习 图像 标记 估计 方法 | ||
本发明提出了一种基于深度贝叶斯学习的图像标记估计方法,包括以下步骤:1)获取图像数据,将图像分发给网络上的标注者进行预标注,构造图像众包标记数据集;2)对图像做特征预提取处理,获得图像的fisher vector特征表示;3)搭建深度表示学习网络,构建标注生成过程的深度贝叶斯模型;4)将图像fisher vector特征及众包标记输入深度贝叶斯模型,基于图像和参数联合概率似然构造变分下界损失函数;5)基于自然梯度随机变分推断,端到端地对深度贝叶斯模型进行训练;6)返回模型输出的图像真实标记估计及各标注者的混淆矩阵。本发明克服了EM迭代式训练的低效率和非贝叶斯学习不可解释性的问题,提高了图像标记估计的效果。
技术领域
本发明涉及图像标注方法,具体涉及一种基于深度贝叶斯学习的图像标记估计方法。
背景技术
图像分类识别模型的学习需要标记来进行训练,而对于许多真实世界的任务来说,获取图像的真实标记是不可能的,因为成本太高。另一方面,近年来众包已经证明自己是作为收集数据标注一种的可靠解决方案。随着Amazon Mechanical Turk和Crowdflower等众包服务平台的出现,众包已经被用于在短时间内收集众多领域的海量标注数据集。显然,利用众包来获取图像分类识别模型所需的图像标记,是一种可行的方法。然而,虽然众包拥有足够的可扩展性,但标注者提供的标记本质上是主观的,不同标注者之间可能存在大量的分歧,而且与标记相关的噪声会限制传统机器学习算法的性能。因此,如何从收集到的标记中估计出潜在的真实标记是众包的一个核心问题。为此已经提出了很多方法,它们有的只使用了标注信息,有的额外使用了数据特征信息。后者中有些方法采用启发式的优化方法,虽然克服了最大期望(Expectation Maximum,EM)类算法的计算问题,但是其并不能保证最大化原学习目标的某些下界,并且需要通过手动调参防止模型过于复杂而过拟合。此外,这些方法为了使得优化容易实现,对于标注者准确率的刻画采用任意取值范围的参数,在某些应用场景如医疗诊断中是不合适的,对于医学图像等专业性强的图像标注,对标注者能力要求较高,通过众包方式进行标注,不可避免地会引入低质量的标注,因此需要对标注者能力进行准确的刻画,这对于理解数据收集过程及数据收集方式的改进具有重要的指导意义。
发明内容
发明目的:针对现有技术的不足,本发明提出一种基于深度贝叶斯学习的图像标记估计方法,解决现有EM迭代式训练的低效率和非贝叶斯学习不可解释性的问题。
技术方案:一种基于深度贝叶斯学习的图像标记估计方法,包括以下步骤:
1)获取图像数据,将图像分发给网络上的标注者进行预标注,获得众包标记L;
2)对图像做特征预提取处理,获得图像的fisher vector特征表示X;
3)搭建深度表示学习网络,构建标注生成过程的深度贝叶斯模型;
4)将图像fisher vector特征X及众包标记L输入深度贝叶斯模型,基于图像和参数联合概率似然构造变分下界损失函数;
5)基于自然梯度随机变分推断,端到端地对深度贝叶斯模型进行训练;
6)返回模型输出的图像真实标记估计及各标注者的混淆矩阵。
其中,所述深度贝叶斯模型为一个完全贝叶斯深度生成式众包模型,包括标注生成过程模型和隐真实标记的先验模型,所述标注生成过程模型对每个标注者采用独立混淆矩阵参数化来刻画标注者的能力,基于标注者混淆矩阵V和图像真实标记Y构造众包标记L的似然p(L∣Y,V);所述隐真实标记的先验模型包括第一先验分布和第二先验分布,所述第一先验分布为数据无关的先验分布,是所有图像共享同样的、由参数π刻画的先验分布p(Y∣π),所述第二先验分布为依赖于输入特征X和参数为γ的神经网络分类器的先验分布p(Y∣X,γ);
得到基于众包标记L、真实标记Y及全局参数Θ={V,π}的联合分布为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010734902.3/2.html,转载请声明来源钻瓜专利网。