[发明专利]基于机器视觉和强化学习的海洋垃圾回收规划方法及系统有效
申请号: | 202111255554.2 | 申请日: | 2021-10-27 |
公开(公告)号: | CN114089656B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 刘长红;林韦任;谢泽文;廖梓鹏;陈凯伟;宋品豪;梁忠伟;刘晓初 | 申请(专利权)人: | 广州大学 |
主分类号: | G05B19/042 | 分类号: | G05B19/042;E02B15/10 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 余凯欢 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 视觉 强化 学习 海洋 垃圾 回收 规划 方法 系统 | ||
1.基于机器视觉和强化学习的海洋垃圾回收规划方法,其特征在于,包括:
采用目标检测算法对海上漂浮垃圾进行目标检测,获取目标数据,所述目标数据包括海上漂浮垃圾数量、类别、位置和距离的信息;
根据所述目标数据建立目标线性系统;
根据所述目标线性系统确定海洋垃圾回收规划策略,并根据所述海洋垃圾回收规划策略对所述海上漂浮垃圾进行清理;
所述根据所述目标数据建立目标线性系统,包括:
从所述目标数据中获取近岸海域的第一垃圾数量、漂浮在远离海岸的海域内的第二垃圾数量以及已被清理回收的第三垃圾数量;
根据所述第一垃圾数量、所述第二垃圾数量和所述第三垃圾数量,计算在第一区域中已被清理回收的垃圾变化情况的第一速率系数、从近岸海域漂流转移到远离海岸的海域的第二速率系数、垃圾从远离海岸的海域漂流转移到近岸海域的第三速率系数、垃圾漂浮面积超出海域面积的第四速率系数以及在第二区域中已被清理回收的垃圾变化情况的第五速率系数;
根据所述第一速率系数、所述第二速率系数、所述第三速率系数、所述第四速率系数以及所述第五速率系数,获取所述第一垃圾数量、所述第二垃圾数量以及所述第三垃圾数量的变化情况;
根据所述第一垃圾数量、所述第二垃圾数量以及所述第三垃圾数量的变化情况,确定垃圾数量随时间变化的目标方程组;
根据所述目标方程组建立目标线性系统;
所述目标方程组的表达式为:
其中,a1代表所述第一速率系数;b1代表所述第二速率系数;b2代表所述第三速率系数;a2代表所述第四速率系数;c1代表所述第五速率系数;N1代表所述第一垃圾数量;N2代表所述第二垃圾数量;N3代表所述第三垃圾数量;代表所述第一垃圾数量随时间变化的第一变化情况;代表所述第二垃圾数量随时间变化的第二变化情况;代表所述第三垃圾数量随时间变化的第三变化情况;
所述根据所述目标线性系统确定海洋垃圾回收规划策略,包括:
当海洋垃圾以近岸垃圾为主时,以所述第一垃圾数量的大小为第一判据,以所述第一变化情况为第二判据,将所述海洋垃圾回收规划策略确定为使得所述第一判据最小且所述第二判据为0;
或者,
当海洋垃圾以远离海岸的垃圾为主时,以所述第二垃圾数量的大小为第一判据,以所述第二变化情况为第二判据,将所述海洋垃圾回收规划策略确定为使得所述第一判据最小且所述第二判据为0。
2.根据权利要求1所述的基于机器视觉和强化学习的海洋垃圾回收规划方法,其特征在于,
所述第一速率系数的计算公式为:
其中,代表第一垃圾数量在单位时间内的变化数量;N1代表第一垃圾数量所在区域内的垃圾总数量。
3.根据权利要求1所述的基于机器视觉和强化学习的海洋垃圾回收规划方法,其特征在于,所述根据所述目标线性系统确定海洋垃圾回收规划策略,还包括:
获取对所述海上漂浮垃圾进行清理的目标装置的历史能源消耗数据;
根据所述历史能源消耗数据计算能源消耗速率;
将所述能源消耗速率作为第三判据;
根据所述第三判据对所述海洋垃圾回收规划策略进行动态调整。
4.根据权利要求3所述的基于机器视觉和强化学习的海洋垃圾回收规划方法,其特征在于,所述根据所述目标线性系统确定海洋垃圾回收规划策略,还包括:
通过基于强化学习机制的策略估计法,对所述第一速率系数和所述第五速率系数进行动态调整;
根据所述第一判据、所述第二判据和所述第三判据确定奖励函数的大小;
根据Q-learning算法和所述奖励函数的大小,将所述第一速率系数和所述第五速率系数作为DQN算法的输入参数进行迭代学习,得到最优策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111255554.2/1.html,转载请声明来源钻瓜专利网。