[发明专利]一种基于深度强化学习的公路裂缝图像分割方法在审
申请号: | 202211602192.4 | 申请日: | 2022-12-13 |
公开(公告)号: | CN115797311A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 高新闻;童佰锐;胡珉;周丽 | 申请(专利权)人: | 上海大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T7/194 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 公路 裂缝 图像 分割 方法 | ||
1.一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,包括如下步骤:
步骤1:对已标注的公路裂缝图像进行预处理,针对公路图像低对比度,复杂纹理的特点,使用ACE算法进行预处理,提高其裂缝和背景的对比度;对于预处理后的图像,计算整个数据集的均值和方差,使用均值和方差对数据集进行标准化;
步骤2:构建合适的深度学习模型对预处理后的公路裂缝图像进行训练,训练完成后使用该模型对公路裂缝图像进行前向推理,获取粗糙的裂缝分割结果;
步骤3:构建马尔可夫决策过程,即深度强化学习中所需的状态值,动作值以及奖励值;
步骤4:使用合适的深度学习网络作为深度强化学习中的值网络和目标网络;将状态值作为深度Q网络的输入,阈值动作集合A中所有阈值对应的Q值作为输出;从经验池中随机抽取部分样本,通过DoubleDQN算法的更新公式计算值网络的参数,并在适当时刻将值网络的参数更新到目标Q网络;
步骤5:在DoubleDQN的迭代过程中,经验池中不断增加智能体探索的样本数据;深度强化学习将从经验池中随机抽取部分样本,通过DoubleDQN算法的更新公式计算目标Q值:
Qtarget=Rt+1+γQ(St+1,argmaxQ(St+1,at+1;w);w′) (1)
其中,St+1表示执行动作后的状态,Rt+1表示执行动作a的奖励,w表示估计值网络的参数,w’表示目标值网络的参数;γ表示奖励的折扣因子,t表示时刻,at+1表示t+1时刻的动作;
步骤6:计算深度Q网络输出的损失值;该损失根据步骤5所得的目标Q值和深度Q网络输出的Q值之间的均方误差获得;同时对深度Q网络中的权重参数使用截断正态分布随机初始化,网络最后的输出层使用Softmax;
其中,B表示一次迭代中的样本数量,i表示样本编号。
2.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所构步骤3建马尔可夫决策过程,即深度强化学习中所需的状态值,动作值以及奖励值如下:
步骤3-1:设置T时刻的分割结果作为深度强化学习的状态值,而算法的初始状态是第一阶段中分割网络模型输出的图像分割结果,该状态也是DoubleDQN网络的输入;
步骤3-2:设置智能体的动作空间,该动作空间也是分割图像需要调整的阈值集合A,根据ε-greedy策略选取相应的动作:在动作集合A中选取一个整数,作为调整分割结果的基准,若选择的动作为ai,则将分割图中像素值在[ai-5,ai+5]的像素置为255;
步骤3-3:设置采取动作前后IoU差值来作为深度强化学习中环境的奖励;若采取动作后分割图的IoU值比采取动作前的IoU大,则奖励设置为1;若是动作前后分割图的IoU相同,则奖励设置为0;若采取动作后分割图的IoU值比采取动作前的IoU小,则奖励设置为-1。
3.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所述步骤4中的经验池是由每个时间步DoubleDQN算法的智能体与环境交互得到的样本,该样本包含4部分:t时刻的状态St,采取的动作a,环境反馈的奖励R,采取动作a之后转变为状态St+1。
4.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所述使用的马尔可夫决策过程中奖励,公式为:
5.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所构建的深度Q网络是一种分类网络,最后一层的神经元数量等于动作空间的大小;深度Q网络作为动作价值函数的网络模型,网络的权重参数为w,用Q(s,a;w)模拟动作值函数Q*(s,a),其中s表示当状态,a表示当前动作,即
Q*(s,a)=Q(s,a;w) (4)
对于深度Q网络的训练使用Adam优化器进行梯度更新,深度Q网络训练完成后,使用分割算法的评价指标IoU和F1-score对算法的分割性能进行评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211602192.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数控锥齿轮加工机床
- 下一篇:一种离心纺丝圆盘式收集装置及其使用方法