[发明专利]一种基于强化学习的车道线的众包数据分段融合方法有效
申请号: | 202010497012.5 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111708856B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 朱紫威;尹玉成;秦峰;罗跃军 | 申请(专利权)人: | 武汉中海庭数据技术有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06T11/20 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 严超 |
地址: | 430000 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 车道 数据 分段 融合 方法 | ||
1.一种基于强化学习的车道线的众包数据分段融合方法,其特征在于,所述方法包括:基于强化学习的智能体完成每段车道线融合;
所述强化学习的智能体的动作环境、动作及对环境的观测和动作奖励根据基于模型融合方法所提供的专家策略确定;
所述基于模型融合方法所提供的专家策略包括:
步骤1,从未融合的数据集合中,选择任意点P为起点,根据设置的第一长度参数a、第一角度参数b以及第一高程参数c确定第一空间范围,得到所述第一空间范围内的待融合点的集合;
步骤2,根据设置的第二角度参数d、第二长度参数e以及第二高程参数f确定所述第一空间范围内的第二空间范围,得到所述第二空间范围内的待拟合点的集合;
步骤3,采用线性模型对所述待拟合点的集合中的待拟合点进行融合,重复所述步骤1~步骤2;
所述基于模型融合方法所提供的专家策略中的所述步骤1中的所述第一空间范围为从所述点P沿角度b方向前进距离a后高程上升值为c*a形成的长方体形;
所述基于模型融合方法所提供的专家策略的所述步骤2中所述第二空间范围内的所述待拟合点,与所述点P处L方向的角度差小于d,与所述长方体形第一空间范围的中线距离小于e,且与所述长方体形第一空间范围的中位面的距离小于f;
所述步骤2得到所述待拟合点的集合后,还包括:判断所述待拟合点的集合中的待拟合点的数量是否超过阈值,是,执行步骤3;否则,将所述点P标记为已融合点后执行步骤1;
所述强化学习的智能体的动作奖励的项目包括:区域内用于融合的点的密度、区域内所使用的拟合点满足拟合条件的程度、区域内拟合结果的值以及拟合结果线段与中心线段的相似程度;
根据所述动作奖励的项目得到r1,r2,r3,r4,r5,r6六个奖励值:
其中,区域内被拟合点应有的总点数M为被拟合点所属的线的数目,为拟合线fli的长度,N'fp为实际的总点数,b1为使奖励为正或负的分界点,λ11,λ12分别为计算时的正负奖励的系数值;
其中,为被拟合点与首点p0之间的角度的均值,Δφ为角度阈值,b2为对应设置的偏置值,λ21,λ22分别为计算时的正负奖励的系数值;
其中,为被拟合点到从p0开始的直线段bl0'的距离的均值,Δd为距离阈值,b3为对应设置的偏置值,λ31,λ32分别为计算时的正负奖励的系数值;
其中,b4为对应设置的偏置值,λ41,λ42分别为计算时的正负奖励的系数值;R2为区域拟合结果的,其计算方法如式:
式中待拟合样本(xi,yi),yi为被拟合的目标值,为每个xi处拟合线的输出,为样本均值;
b5为对应设置的偏置值,λ51,λ52分别为计算时的正负奖励的系数值;f2的确定过程为:根据角度的相关性得到的相似度计算方法计算以线段fli首尾两个端点所组成的点集为A,ali首尾两个端点所组成的点集B为输入,求解最小化问题:min||AΩ-B||F s.tΩTΩ=I;其中I表示单位矩阵;f2为矩阵Ω的Frobenius范数;
其中,Δl=||AΩ-B||F,b6为对应设置的偏置值,λ61,λ62分别为计算时的正负奖励的系数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中海庭数据技术有限公司,未经武汉中海庭数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010497012.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于地学专家知识的网页地学相关性计算方法
- 下一篇:一种高分子材料泵