[发明专利]图像标志点识别模型训练方法和装置在审
申请号: | 202111541593.9 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114266948A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 牛建伟;杜东峰;蒋亦然;李青锋;宋广瀛;许天民 | 申请(专利权)人: | 北京航空航天大学杭州创新研究院 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/42;G06V10/26;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 戴尧罡 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标志 识别 模型 训练 方法 装置 | ||
本申请提供一种图像标志点识别模型训练方法和装置,通过获取多张训练图像,而各张训练图像包含多个标记点,各标记点具有原始坐标。针对每张训练图像,基于高斯金字塔结构获得该训练图像的多张不同分辨率的图像块,并获得各图像块对应的特征图。将各特征图导入构建的多层神经网络模型,基于各特征图中的标记点的原始坐标以及模型输出的坐标信息构建的损失函数对模型进行训练,直至损失函数达到收敛时,得到基于多层神经网络模型训练得到的识别模型。本申请通过高斯金字塔结构可得到多张不同分辨率的图像块,使得模型可以学习到不同分辨率的图像的特征信息,进而可以提高后续在应对不同分辨率的图像识别的准确性。
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种图像标志点识别模型训练方法和装置。
背景技术
深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
迄今为止,在计算机视觉领域,深度卷积网络现在已经成为首选架构。医学图像分析界已经注意到了这些关键的发展。并且也在逐渐转向各种深度学习网络模型,在医学图像分析方法中利用这些技术可以缩短临床医生的诊断流程,也因此,深度学习在这一领域的应用还有很大的空间。在医疗影像应用中需要解决的关键问题之一是由于多种成像设备差异带来的图像质量和像素分布差异导致模型在小误差要求下识别准确率较低。主要原因是在深度学习的处理过程中,网络对于多精度像素信息的处理上存在不足,导致得到的识别模型应对不同精度的图像识别时准确率较低。
发明内容
本申请的目的包括,例如,提供了一种图像标志点识别模型训练方法和装置,其能够使得训练得到的模型可以学习到不同分辨率的图像的特征信息,进而提高对应不同分辨率的图像识别的准确性。
本申请的实施例可以这样实现:
第一方面,本申请提供一种图像标志点识别模型训练方法,所述方法包括:
获取多张训练图像,各所述训练图像包含多个标记点,各所述标记点具有原始坐标;
针对每张训练图像,基于高斯金字塔结构获得该训练图像的多张不同分辨率的图像块,并获得各所述图像块对应的特征图;
将各所述特征图导入构建的多层神经网络模型,基于各所述特征图中标记点的原始坐标以及模型输出的坐标信息构建的损失函数对模型进行训练,直至所述损失函数达到收敛时,得到基于所述多层神经网络模型训练得到的识别模型。
在可选的实施方式中,所述基于高斯金字塔结构获得该训练图像的多张不同分辨率的图像块的步骤之前,所述方法还包括:
针对各所述训练图像,对所述训练图像中所有像素点的像素值进行归一化处理,以使归一化后各像素点的像素值处于预设像素分布范围内。
在可选的实施方式中,所述针对每张训练图像,基于高斯金字塔结构获得该训练图像的多张不同分辨率的图像块的步骤,包括:
针对每张训练图像,基于高斯金字塔结构获得该训练图像对应的不同分辨率、不同尺寸的多张处理图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学杭州创新研究院,未经北京航空航天大学杭州创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111541593.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种麻醉用麻醉辅助支架及其使用方法
- 下一篇:一种光缆固定装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序