[发明专利]防疫机器人知识学习与迁移方法和系统有效
申请号: | 202011119623.2 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112231489B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 高洪波;郝正源;李智军 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08;G16H50/70;G16H50/80 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 230041 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 防疫 机器人 知识 学习 迁移 方法 系统 | ||
本发明提供了一种防疫机器人知识学习与迁移方法和系统,包括:步骤1:根据机器人应用的防疫场景,构建基于人工和先验知识的子任务离线知识库;步骤2:根据离线知识库构建基于多任务的子任务网络模型,并进行任务迁移学习训练;步骤3:基于子任务网络模型和任务迁移学习训练构建知识推理引擎;步骤4:根据知识推理引擎构建知识图谱;步骤5:根据知识图谱进行基于任务环境的模式训练;步骤6:根据基于任务环境的模式训练成果进行知识迁移。本发明让机器人在疫情防控中的使用可以更为广泛,从而解放了人力,并减小工作人员在疫情防控中被感染的风险,可以在疫情的防控中起到重要的作用。
技术领域
本发明涉及防疫机器人技术领域,具体地,涉及一种防疫机器人知识学习与迁移方法和系统。
背景技术
机器人经常被用来从事危险、重复性高的工作以解放人力。恰好能够满足对于防疫的要求。因此越来越多的地方考虑采用防疫机器人进行疫情防控工作。对于防疫机器人来说,其通过自主学习并不断更新的能力是非常必要的,但是传统的卷积神经网络在小样本条件下的训练样本不足、训练开销大、样本标签少等,且在新环境中难以应用,本文提出的一种防疫机器人知识学习与迁移方法正好可以解决此问题。
专利文献CN109740741A(申请号:201910017601.6)公开了一种结合知识转移的强化学习方法,步骤如下:S1、设计BP神经网络自主任务间映射关系;S2、对源任务学习经验进行案例存储,并构建线性感知器来学习源域和目标域之间的动作映射关系;S3、运用基于案例推理机理;S4、进行相似度计算与案例检索,并运用所学到的案例库中的经验作为启发式来加速相关但不同任务的学习;及其应用于无人车自主技能的学习方法。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种防疫机器人知识学习与迁移方法和系统。
根据本发明提供的防疫机器人知识学习与迁移方法,包括:
步骤1:根据机器人应用的防疫场景,构建基于人工和先验知识的子任务离线知识库;
步骤2:根据离线知识库构建基于多任务的子任务网络模型,并进行任务迁移学习训练;
步骤3:基于子任务网络模型和任务迁移学习训练构建知识推理引擎;
步骤4:根据知识推理引擎构建知识图谱;
步骤5:根据知识图谱进行基于任务环境的模式训练;
步骤6:根据基于任务环境的模式训练成果进行知识迁移。
优选的,所述任务包括:体温检测,包括单人体温检测和多人体温同时检测;口罩佩戴识别;人流密度监测;防疫播报;环境消毒杀菌;疫情宣传与导诊;提供隔离区娱乐互动;远程医生咨询;
采用红外温度传感器、摄像头、语音播报系统和人机交互系统进行任务的实施。
优选的,所述步骤2包括:
根据整体任务规划和分解后的独立子任务,进行子任务网络模型的构建;
利用独立子任务的关节动作、室内环境、防疫机器人移动路径的数据集,对各子任务网络模型进行训练;
对输入的子任务数据集进行迭代,通过前向传递和反向传播梯度,根据预设更新规则更新网络中的权重值,完成网络初步训练。
优选的,所述步骤3包括:
通过对输入的数据集进行前向传导,输出特征图,利用全连接网络输出基于输入的数据集的条件概率分布,构建知识推理引擎。
优选的,所述步骤4包括:
基于知识推理引擎、先验知识和训练好的子任务网络模型,进行数据特征提取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011119623.2/2.html,转载请声明来源钻瓜专利网。