[发明专利]一种状态控制方法及装置有效
申请号: | 202011449143.2 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112561057B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 施路平;田雷;吴臻志 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06N3/06 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 状态 控制 方法 装置 | ||
本申请关于一种状态控制方法及装置。所述方法包括:获取目标对象当前执行的任务所在的环境特征信息;将当前状态的状态信息以及所述环境特征信息输入至状态控制网络中,经所述状态控制网络输出是否需要状态转移的判断结果,以及在所述判断结果为需要状态转移的情况下,输出需要执行的任务以及下一个状态的状态信息;所述状态控制网络包括下述中的一种神经网络类型:人工神经网络、脉冲神经网络、基于人工神经网络和脉冲神经网络的混合神经网络。本申请实施例提供的状态控制方法能够完成多种复杂的任务,不仅能够完成基于内容的分支任务,还可以完成序列化的任务,具有较高的鲁棒性。
技术领域
本申请涉及人工智能技术领域,尤其涉及状态控制方法及装置。
背景技术
目前,人工智能的研究方向主要包括神经科学导向和计算机科学导向两大类。其中,神经科学导向的以脉冲神经网络(Spiking Neuron Networks,SNN)为代表,计算机科学导向的以人工神经网络(Artificial Neural Network,ANN)为代表。两者在完成特定领域的特定任务中,具有各自的优势。
为了发展通用人工智能(Artificial general intelligence,AGI)技术,一个可行的方法就是融合上述两种神经网络的优势,让不同的神经网络协同工作。因而,需要能够对不同神经网络调度和控制的状态控制方式,以适应复杂的应用场景和任务。相关技术中,可以利用ANN实现状态控制,如循环神经网络(Recurrent Neural Network,RNN)。但是由于ANN实现状态控制需要可微分网络,并使用全局梯度下降法训练网络,但是训练难度较大,因此,ANN难以实现具有多个状态和转移条件的完整状态机。相关技术中还有一些不可微分的方法,例如强化学习或者递归树搜索等,但是这些方法的状态控制部分是任务特定的,并且过于复杂以至于无法转移到其他任务。
因此,相关技术中亟需一种能够实现多个复杂任务的状态控制方式。
发明内容
本申请实施例的目的在于提供一种状态控制方法及装置。
本申请实施例提供的状态控制方法及装置是这样实现的:
一种状态控制方法,所述方法包括:
获取目标对象当前执行的任务所在的环境特征信息;
将当前状态的状态信息以及所述环境特征信息输入至状态控制网络中,经所述状态控制网络输出是否需要状态转移的判断结果,以及在所述判断结果为需要状态转移的情况下,输出需要执行的任务以及下一个状态的状态信息;所述状态控制网络包括下述中的一种神经网络类型:人工神经网络、脉冲神经网络、基于人工神经网络和脉冲神经网络的混合神经网络。
可选的,在本申请的一个实施例中,所述获取目标对象当前执行的任务所在的环境特征信息,包括:
获取当前执行的任务所在的环境信息;
将所述环境信息输入至特征提取网络,经所述特征提取网络输出所述环境信息对应的环境特征信息。
可选的,在本申请的一个实施例中,所述特征提取网络包括下述中的一种神经网络类型:人工神经网络、脉冲神经网络、基于人工神经网络和脉冲神经网络的混合神经网络。
可选的,在本申请的一个实施例中,所述环境信息包括下述中的至少一种信息类型:声音、文本、图像、视频。
可选的,在本申请的一个实施例中,所述将当前状态的状态信息以及所述特征信息输入至状态控制网络中,经所述状态控制网络输出是否需要状态转移的判断结果,包括:
将所述特征信息转换为与所述状态控制网络的神经网络类型相匹配的输入信号;
将当前状态的状态信息以及所述特征信息对应的所述输入信号输入至状态控制网络中,经所述状态控制网络输出是否需要状态转移的判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011449143.2/2.html,转载请声明来源钻瓜专利网。