[发明专利]一种基于机器学习的图像中心线结构提取方法在审
申请号: | 202210780746.3 | 申请日: | 2022-07-04 |
公开(公告)号: | CN115082770A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 王鑫;赵相欣;马京生;仲昭岩;黄奇杰;段利亚 | 申请(专利权)人: | 青岛科技大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/40;G06V10/764;G06V10/774;G06V10/82;G06N3/08;G06N20/00 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 王楠 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 图像 中心线 结构 提取 方法 | ||
1.一种基于机器学习的图像中心线结构提取方法,其特征在于,包括步骤如下:
第一步,学习用于提取图像特征的滤波器;
搭建无监督的ResNet网络在训练数据集下获得预训练特征,然后在开源的SPAMS软件基础上,对预训练特征进行稀疏矩阵分解,从而获得用于提取特征的滤波器;
第二步,对滤波器进行分解获取可分离的滤波器;
将一个全秩滤波器组表示为可分离滤波器组的线性组合,将第一步的滤波器堆叠从而得到三维张量F,将三维张量F写成K个三维一阶张量的线性组合:
其中,K为分解的一阶张量数目,k为一阶张量的索引,为第k个一阶张量的第一维向量,为第k个一阶张量的第二维向量,为第k个一阶张量的第三维向量;
对于三维张量F在第三个维度上的每个切片则有:
其中,fi为三维张量F在第三个维度上的第i个切片,为在第k个张量的第三个维度向量的第i个分量值,sk为第k个张量的第一、第二维度上对应的两个向量的叉乘;
第三步,对训练数据进行特征提取;
使用第二步中获得的可分离滤波器来对训练数据集进行特征提取;
第四步,建立回归树模并进行训练
将中心线检测问题进行建模,转化为数学模型中的回归问题:
其中,d(x)是回归树模型拟合的目标函数,D(x)是点到中心线的欧氏距离,d0是可分离滤波器尺寸的一半;
回归树的基本模型:
其中,是树模型,f(x,I)就是第三步在图像上提取的像素点x对应的特征,T是弱学习器总数目,ht是第t个弱学习器,ωt是第t个弱学习器对应的权重,采用决策树中的分类与回归树模型作为此处的弱学习器ht,树的深度选取为10,树的数目选取为500;
最小化损失函数:
其中,是损失函数在模型上的总和,是衡量第i个标签值di和预测值差距的损失函数;
选用平方损失函数:
最后,使用作为函数d(x)的最终近似值;
第五步,模型训练完成后对测试数据进行预测,将测试数据图像代入第三步,利用第二步得到的滤波器对测试数据的所有图像进行特征提取,得到所有图像中每个像素点对应的特征,提取出的特征代入训练好的模型公式(8)中,得到测试数据每张图每个像素点对应的预测结果,即可以得到预测的中心线图像。
2.根据权利要求1所述的基于机器学习的图像中心线结构提取方法,其特征在于,第二步中,将第一步的滤波器堆叠从而得到高维张量F,对于高维度的张量同理:
其中,n为张量的维度数目。
3.根据权利要求1所述的基于机器学习的图像中心线结构提取方法,其特征在于,第三步中,如果训练数据集图像超过一万张时,那么获取的样本特征数目将过于庞大,此时可以从正负样本中分别选取部分样本使用,所述部分样本为根据数据按照0.5的比例来选取样本,所述样本指的是训练数据图像上的像素点,正样本是中心线上的点,负样本是中心线外的点。
4.根据权利要求1所述的基于机器学习的图像中心线结构提取方法,其特征在于,第三步中,考虑图像中每个像素点周围的像素信息,即使用了图像的上下文信息,对于每个像素,不仅从以该像素为中心的局部窗口提取特征,而且对可分离滤波器尺寸大小的半径内的像素提取特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210780746.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:对象的识别方法、装置、计算机可读存储介质及电子设备
- 下一篇:一种取栓支架
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序