[发明专利]一种基于深度强化学习的公路裂缝图像分割方法在审

专利信息
申请号: 202211602192.4 申请日: 2022-12-13
公开(公告)号: CN115797311A 公开(公告)日: 2023-03-14
发明(设计)人: 高新闻;童佰锐;胡珉;周丽 申请(专利权)人: 上海大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/11;G06T7/194
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 何文欣
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 强化 学习 公路 裂缝 图像 分割 方法
【权利要求书】:

1.一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,包括如下步骤:

步骤1:对已标注的公路裂缝图像进行预处理,针对公路图像低对比度,复杂纹理的特点,使用ACE算法进行预处理,提高其裂缝和背景的对比度;对于预处理后的图像,计算整个数据集的均值和方差,使用均值和方差对数据集进行标准化;

步骤2:构建合适的深度学习模型对预处理后的公路裂缝图像进行训练,训练完成后使用该模型对公路裂缝图像进行前向推理,获取粗糙的裂缝分割结果;

步骤3:构建马尔可夫决策过程,即深度强化学习中所需的状态值,动作值以及奖励值;

步骤4:使用合适的深度学习网络作为深度强化学习中的值网络和目标网络;将状态值作为深度Q网络的输入,阈值动作集合A中所有阈值对应的Q值作为输出;从经验池中随机抽取部分样本,通过DoubleDQN算法的更新公式计算值网络的参数,并在适当时刻将值网络的参数更新到目标Q网络;

步骤5:在DoubleDQN的迭代过程中,经验池中不断增加智能体探索的样本数据;深度强化学习将从经验池中随机抽取部分样本,通过DoubleDQN算法的更新公式计算目标Q值:

Qtarget=Rt+1+γQ(St+1,argmaxQ(St+1,at+1;w);w′) (1)

其中,St+1表示执行动作后的状态,Rt+1表示执行动作a的奖励,w表示估计值网络的参数,w’表示目标值网络的参数;γ表示奖励的折扣因子,t表示时刻,at+1表示t+1时刻的动作;

步骤6:计算深度Q网络输出的损失值;该损失根据步骤5所得的目标Q值和深度Q网络输出的Q值之间的均方误差获得;同时对深度Q网络中的权重参数使用截断正态分布随机初始化,网络最后的输出层使用Softmax;

其中,B表示一次迭代中的样本数量,i表示样本编号。

2.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所构步骤3建马尔可夫决策过程,即深度强化学习中所需的状态值,动作值以及奖励值如下:

步骤3-1:设置T时刻的分割结果作为深度强化学习的状态值,而算法的初始状态是第一阶段中分割网络模型输出的图像分割结果,该状态也是DoubleDQN网络的输入;

步骤3-2:设置智能体的动作空间,该动作空间也是分割图像需要调整的阈值集合A,根据ε-greedy策略选取相应的动作:在动作集合A中选取一个整数,作为调整分割结果的基准,若选择的动作为ai,则将分割图中像素值在[ai-5,ai+5]的像素置为255;

步骤3-3:设置采取动作前后IoU差值来作为深度强化学习中环境的奖励;若采取动作后分割图的IoU值比采取动作前的IoU大,则奖励设置为1;若是动作前后分割图的IoU相同,则奖励设置为0;若采取动作后分割图的IoU值比采取动作前的IoU小,则奖励设置为-1。

3.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所述步骤4中的经验池是由每个时间步DoubleDQN算法的智能体与环境交互得到的样本,该样本包含4部分:t时刻的状态St,采取的动作a,环境反馈的奖励R,采取动作a之后转变为状态St+1

4.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所述使用的马尔可夫决策过程中奖励,公式为:

5.根据权利要求1所述的一种基于深度强化学习的公路裂缝图像分割方法,其特征在于,所构建的深度Q网络是一种分类网络,最后一层的神经元数量等于动作空间的大小;深度Q网络作为动作价值函数的网络模型,网络的权重参数为w,用Q(s,a;w)模拟动作值函数Q*(s,a),其中s表示当状态,a表示当前动作,即

Q*(s,a)=Q(s,a;w) (4)

对于深度Q网络的训练使用Adam优化器进行梯度更新,深度Q网络训练完成后,使用分割算法的评价指标IoU和F1-score对算法的分割性能进行评估。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211602192.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top