[发明专利]一种基于强化学习的自动化机器学习系统在审
申请号: | 202011494630.0 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112488323A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 王腾;袁翰青;杨会峰;王占魁;孙辰军;王静;周文芳;遇炳杰;樊京杭;杨钰雪 | 申请(专利权)人: | 国网河北省电力有限公司;国家电网有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06F16/21 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 齐兰君;张杰 |
地址: | 050022 河北省石*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 自动化 机器 系统 | ||
1.一种基于强化学习的自动化机器学习系统,包括学习库以及与学习库进行智能交互的自动化机器,其特征在于:
自动化机器:用于获取用户发出的学习指令,并发送至学习库;
学习库:用于接收自动化机器发送的学习指令,执行学习动作,并向自动化机器发送学习结果,其中:
所述学习库包括有指令接收模块、学习模块、结果输出模块和期望计算模块,所述指令接收模块、学习模块、结果输出模块和期望计算模块通信连接,其中:
指令接收模块,用于获取用户发出的学习指令,屏蔽不同机器学习算法之间的异构性,并将该学习指令发送至学习模块;
学习模块,用于接收指令接收模块发送的学习指令,依据预存的学习行为执行学习动作,并向结果输出模块发送学习结果;
期望计算模块,用于接收结果输出模块发送的学习结果,依据预存的期望模型计算期望值。
2.根据权利要求1所述的基于强化学习的自动化机器学习系统,其特征在于,所述指令接收模块包括有指令接收单元、异构性屏蔽单元和指令发送单元,指令接收单元、异构性屏蔽单元和指令发送单元通信连接,其中:
异构性屏蔽单元使用统一的API接口,屏蔽不同的机器学习算法库之间的异构性。
3.根据权利要求2所述的基于强化学习的自动化机器学习系统,其特征在于,所述学习模块包括有学习行为预存单元、学习单元和知识库,所述学习单元分别与学习行为预存单元和知识库相互连接,其中:
学习行为预存单元,用于获取用户预存的学习行为模型;
知识库,用于获取用户预存的学习资料;
学习单元,根据学习指令获取学习行为预存单元中适用于该学习指令的学习方式,根据学习指令获取知识库中适用于该学习指令的学习资料,结合学习方式和学习资料进行机器学习,得到学习结果。
4.根据权利要求3所述的基于强化学习的自动化机器学习系统,其特征在于,所述期望计算模块包括学习结果获取单元、期望模型预存单元和平均值计算单元,所述学习结果获取单元、期望模型预存单元和平均值计算单元通信连接,其中:
学习结果获取单元,用于从学习单元中获取学习结果,并发送至期望模型预存单元;
期望模型预存单元,用于预存用户输入的期望模型,并从学习结果获取单元中接收学习结果,依据该期望模型进行学习结果分析,得到期望值并发送给平均值计算单元;
平均值计算单元,用于接收期望模型预存单元发送的期望值,依据学习行为类型计算期望平均值:
其中:n为第i类学习行为的学习次数;
为第类学习行为的学习结果期望值。
5.根据权利要求1-4任一所述的基于强化学习的自动化机器学习系统,其特征在于,所述自动化机器包括有学习指令输入单元、学习指令输出单元和学习结果显示单元,所述学习指令输入单元和学习指令输出单元相连接,学习结果显示单元分别与学习单元和期望模型预存单元相连接,其中:
学习结果显示单元,用于分别从学习单元和期望模型预存单元中获取学习结果和学习结果期望值,并向用户进行显示。
6.根据权利要求5所述的基于强化学习的自动化机器学习系统,其特征在于,所述学习结果显示单元还与平均值计算单元相连接,用于获取多类学习行为的期望平均值,并向用户进行显示。
7.根据权利要求3所述的基于强化学习的自动化机器学习系统,其特征在于,所述学习行为包括印痕学习、联想学习和推理学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司;国家电网有限公司,未经国网河北省电力有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011494630.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交流单相串激电机调速控制电路
- 下一篇:一种呼吸科临床输氧加湿装置