[发明专利]基于统计假设检验的学习自动机实现系统及方法在审
申请号: | 202010662967.1 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111832823A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 狄冲;王嘉略;杨君中;李生红;董之微;金世鑫;任帅;朱钰;赵东艳 | 申请(专利权)人: | 上海交通大学;国网辽宁省电力有限公司电力科学研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06N20/00;H04L29/06 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统计 假设检验 学习 自动机 实现 系统 方法 | ||
1.一种基于统计假设检验的学习自动机实现系统,其特征在于,包括:
导入模块:在泛在电力物联网中,采用积极初始化算法,导入先验知识;
动作选择模块:根据先验知识,采用统一选择策略选取动作,构建动作集;
动作集更新模块:采用统计假设检验算法从动作集中消除不符合预设规则的动作;
收敛判断模块:判断动作集大小,若不符合预设规则,则回调动作集更新模块,将剩余动作与环境进行交互,继续消除不符合预设规则的动作,直至动作集中仅剩一个动作,此时判断为已收敛,结束训练。
2.根据权利要求1所述的基于统计假设检验的学习自动机实现系统,其特征在于,所述积极初始化算法,对于每个动作ai的反馈序列Fi(0)的值随机地从{0,1}中设置。
3.根据权利要求2所述的基于统计假设检验的学习自动机实现系统,其特征在于,所述动作选择模块的学习过程分为多个回合,每个回合与环境的交互组成;其中每个回合的索引用l=1,2,3...L表示,L是直到收敛为止的总回合数;在第l回合设置的动作用A(l)表示,大小用|A(l)|表示;
统一选择策略在第l轮中,当前动作集A(l)中的每个动作均被无差别地选择一次与环境交互。
4.一种基于统计假设检验的学习自动机实现方法,其特征在于,采用权利要求3所述的基于统计假设检验的学习自动机实现系统,包括:
步骤1:根据林德伯格列维定理,将两个动作的收敛概率作为两个高斯随机变量的均值进行比较,从而引入z检验:
步骤2:通过比较收敛概率确定预定最佳动作,通过将任意一个动作与预定最佳动作的z检验统计量与临界值进行比较,剔除次优动作,更新动作集,进而确定最佳动作。
5.根据权利要求4所述的基于统计假设检验的学习自动机实现方法,其特征在于,所述林德伯格列维定理包括:假设动作ai被选择了n次,反馈序列为{βi(1),βi(2),···,βi(n)},Pr{βi(k)=1}=di,Pr{βi(k)=0}=1-di,则有:
βi(1)表示动作ai的第一个反馈序列;di表示动作ai的任意一个反馈序列被选中的概率值;k表示计数,动作ai对应的任意一个反馈序列;N表示正态分布;pr表示动作ai的任意一个反馈序列被选中的概率。
6.根据权利要求5所述的基于统计假设检验的学习自动机实现方法,其特征在于,动作集更新的过程包括:
在第l轮学习过程结束后,对于动作ai∈A(l),反馈序列记为:Fi(l)={βi(1),βi(2),···,βi(l+2)};
根据林德伯格列维定理,有:
将动作的最大预定收敛概率定义为反馈序列的均值:
第l轮学习过程结束后预定最佳动作am(l)为具备最大预定收敛概率的动作:
该动作的反馈序列记为:Fm(l)={βm(1),βm(2),···,βm(l+2)};βm(1)表示最佳动作am的第一个反馈序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;国网辽宁省电力有限公司电力科学研究院,未经上海交通大学;国网辽宁省电力有限公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662967.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:异常流量检测系统及方法
- 下一篇:一种葡萄酒生产废水废物资源化利用方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理