[发明专利]轨道AI巡检机器人智能控制系统有效
申请号: | 202310497047.2 | 申请日: | 2023-05-05 |
公开(公告)号: | CN116203973B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 陆立明;陆泽鑫;周连杰;刘丹;刘晓利 | 申请(专利权)人: | 唐山昌宏科技有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 唐山永和专利商标事务所 13103 | 代理人: | 张紫亮 |
地址: | 063021 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轨道 ai 巡检 机器人 智能 控制系统 | ||
1.一种轨道AI巡检机器人智能控制系统,其特征在于,包括环境信息收集模块、环境地图构建模块、智能巡检模块;首先,通过安装在巡检机器人上的传感器,识别周围环境并收集环境信息,采用SURF算法对环境进行感知,通过改进的BP神经网络,对多重信息进行融合,采用视觉感知技术,获取周围物体的立体图像,并通过视觉处理器对图像进行处理分析,构建巡检机器人的视觉系统;其次构建巡检机器人周围地图,且对自身位置进行定位;最后采用Q-learning人工智能算法,选择需要巡检的关键位置,自动规划巡检路线,在移动过程中主动识别障碍物并避让;
所述环境信息收集模块,对周围收集的环境信息进行筛选表示,详细过程如下:
巡检机器人采用SURF算法筛选表示所在周围环境;SURF算法采用方形滤波器,滤波器函数如下:
;
表示滤波器函数,i,j代表像素点的坐标值,、代表各方向上总像素点个数;特征点提取时,利用图像每个像素点的海森矩阵,像素点x(i,j),在尺度为下的海森矩阵为:
;
、、分别代表高斯二阶导数、、在x、y处对于图像的卷积,采用盒子滤波器替换根据海森矩阵的和行列式提取极值点:
;
、代表权重,用特征向量描述特征点信息,以特征点为中心构造一个方向为特征点主方向的正方形邻域,对邻域进行均匀分割,计算每个小区域上所有像素点在x和y方向上的响应和总响应,得四维特征向量v:
;
、代表x,y方向上的小波转换总和,、分别代表x,y方向上的向量长度总和,所有子区域的特征向量形成特征描述符;
所述环境信息收集模块,将筛选的信息进行融合,详细过程如下:
采用基于改进的神经网络的多信息融合技术,对周围环境进行信号提取融合,根据粒子群算法构建寻优公式:
;
;
、、、分别表示第i个粒子在第k+1、k次迭代时的位置矢量,表示权重,、为加速度常数,、分别代表粒子i的历史最优适应度在第k次迭代的位置和粒子i的历史最优适应度在第k次迭代的位置矢量;采用BAS算法对信息数据进行改进,创建两方向模型:
;
;
、分别表示第k次迭代时方向1和方向2上的位置坐标,表示第k次迭代时的质心坐标,表示第k次迭代时两方向的距离;更新迭代位置:
;
f表示符号函数,、代表、时的适应度,表示第k次迭代时的步长因子,更新距离和步长:
;
;
、分别表示距离衰减系数和步长衰减系数,、分别代表最小距离阈值和最小步长阈值,计算粒子行为增量:
;
代表第k+1次迭代时的行为增量,改进的寻优公式:
;
;
表示为行为增量的权重系数,可计算:
;
、分别代表权重系数的最大值和最小值,k代表当前迭代系数,代表总的迭代系数;采用改进的BP神经网络算法,降低信息特征维数,提高数据融合效率和融合精度,根据LEACN算法完成分簇,将信息传入簇首节点,每轮簇首节点更新,分簇形成后,簇首记录节点信息并传入基础节点,基础节点根据传入信息确定BP神经网络结构,选取相匹配的数据集,确定空间维度,簇内节点个数代表输入层神经元个数Q,隐藏层神经元个数为O,输出层神经元个数为1,空间维度E为:
;
初始化位置向量,计算舒适度h,公式如下:
;
m为样本数据训练数量,代表第i个样本数据的融合预测值,代表i个样本数据实测值,根据适应度,确定粒子的最佳位置,计算行为增量,更新粒子的速度和位置,基础点与BP神经网络链接,将权值和阈值传入簇节点,簇内根据权重和阈值构建相应的BP神经网络,对上传信息进行融合处理,将融合结果传入基础点,完成一轮信息融合;
所述环境地图构建模块,构建完整的巡视机器人周围环境地图,详细过程如下:
构建栅格-拓扑混合地图,底层通过算法完成定位与地图创建,位置的数学模型如下:
;
表示巡检机器人i时刻的位置,表示巡检机器人上传感器观测到的i个目标,表示机器人在处观测到的观测数据,代表输入控制数据,、分别代表位置噪声和观测噪声;对目标点数据结构为:
;
d代表目标点深度信息,代表目标点编号,代表目标点的类型,调整初始目标点:
;
r表示对应半径,、分别表示目标点左右两端的编号,构建栅格地图,栅格地图的构建必须基于障碍物出现的概率,栅格地图将环境划分成一系列网格,网格为空取0,网格存在取1,引入贝叶斯模型,更新网格状态,用m表示各个网格,表示位置的网格,有如下等式:
;
网格点状态t为:
;
状态更新方程为:
;
创建拓扑地图,将拓扑节点T的数据结构定义为:
;
代表优化后巡检机器人位姿,代表当前节点的候选目标点集合,、分别代表父节点和子节点,对中目标点集合拓展为:
;
代表目标点全局位置,代表目标的效用函数,d代表目标点距离信息,代表目标点编号,代表目标点的类型,效用函数表达式如下:
;
p为后选点,为信息收益,L为机器人位置与目标点之间的欧式距离,表示机器人与目标点之间的连线与机器人正方向之间的夹角绝对值,、分别表示距离和夹角的系数对创建的栅格地图和拓扑地图进行融合,形成栅格-拓扑混合地图;
所述智能巡检模块,根据环境信息,自动规划巡检路径,详细过程如下:
巡检机器人通过人工智能路径算法,自动进行巡检路线规划,行为价值函数Q更新方程如下:
;
Q代表价值函数,s表示当前状态,a表示当前动作,r表示再当前状态下执行动作的奖励,表示下一状态,表示下一动作,表示学习率,表示下一动作和下一状态的折扣系数,表示当前状态和当前动作的折扣系数;建立矩阵储存Q值:
;
选择贪婪策略,基于人工势场法更新价值函数,人工势场法包含引力势场函数和斥力势场函数,引力势场函数为:
;表示引力势场函数,代表引力增益系数,q代表巡检机器人位置,代表目标点位置,表示巡检机器人位置与目标点位置的欧几里得距离;引力函数为:;
巡检机器人向目标点行驶过程中,障碍物产生斥力势场,斥力势场函数为:
;
为斥力势场函数,为斥力增益系数为目标点的斥力作用范围,超出作用范围为0,代表作用范围的系数,斥力函数为:
;代表巡检机器人位置与目标点位置的欧几里得距离的梯度,利用贪婪策略在初始状态执行初始动作,得到奖励r,更新状态;比较巡检机器人与目标点之间的欧几里得距离与目标点斥力作用范围的大小,当取,根据贪婪策略在新状态下,更新价值函数:;
通过Q-learning强化学习算法,结合标记的重要位置,自动规划巡检路线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于唐山昌宏科技有限公司,未经唐山昌宏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310497047.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于元学习的静态动态协同图卷积交通预测方法
- 下一篇:一种电池组