[发明专利]一种用于睡眠分期的模型训练方法及装置在审
申请号: | 202010963626.8 | 申请日: | 2020-09-14 |
公开(公告)号: | CN112149541A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 张沕琳;廖一桥;谢翔;王志华 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/00 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 睡眠 分期 模型 训练 方法 装置 | ||
1.一种用于睡眠分期的模型训练方法,其特征在于,所述方法包括:
构建用于睡眠分期的单通道输入竞争学生模型和多通道输入教师模型;
将多通道信号输入所述教师模型,并根据所述教师模型的输出获得教师模型损失,将所述多通道信号中的预设通道信号输入所述竞争学生模型,并根据所述竞争学生模型的输出获得竞争学生模型损失;根据所述教师模型中隐含层的输出和所述竞争学生模型中隐含层的输出确定知识迁移损失;根据所述竞争学生模型损失、所述教师模型损失和所述知识迁移损失对所述教师模型和所述竞争学生模型进行优化,直至满足停止条件;
根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,并基于知识蒸馏技术对所述合作学生模型进行训练,以将已训练教师模型的知识迁移到所述合作学生模型。
2.根据权利要求1所述的方法,其特征在于,所述教师模型包括针对每一输入通道的低层次CNN和针对各个低层次CNN的输出拼接后的高层次CNN,且每一输入通道的低层次CNN由分组卷积实现;
所述竞争学生模型包括针对单输入通道的低层次CNN和高层次CNN,所述单输入通道的低层次CNN共享所述教师模型中各个低层次CNN基于通道洗牌得到的参数。
3.根据权利要求2所述的方法,其特征在于,所述合作学生模型包括针对单输入通道的低层次CNN和高层次CNN;
根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,包括:
将已训练教师模型中针对所述预设通道的低层次CNN中的参数作为所述合作学生模型中针对单输入通道的低层次CNN的初始参数;
将已训练竞争学生模型中高层次CNN中的参数作为所述合作学生模型中高层次CNN的初始参数。
4.根据权利要求1所述的方法,其特征在于,根据所述竞争学生模型损失、所述教师模型损失和所述知识迁移损失对所述教师模型和所述竞争学生模型进行优化,包括:
在执行第一预设训练次数过程中,根据所述竞争学生模型损失、所述教师模型损失、所述知识迁移损失以及知识迁移损失的第一系数对所述教师模型和所述竞争学生模型进行优化;
在执行第二预设训练次数过程中,根据所述竞争学生模型损失、所述教师模型损失、所述知识迁移损失以及知识迁移损失的第二系数对所述教师模型和所述竞争学生模型进行优化;
其中,所述第一系数小于所述第二系数。
5.根据权利要求4所述的方法,其特征在于,基于知识蒸馏技术对所述合作学生模型进行训练,包括:
将多通道信号输入已训练教师模型,并根据已训练教师模型的输出获得教师模型损失,将所述多通道信号中的预设通道信号输入所述合作学生模型,并根据所述合作学生模型的输出获得合作学生模型损失;
根据所述已训练教师模型的输出和所述合作学生模型的输出确定知识迁移损失;
根据所述合作学生模型损失、所述教师模型损失、所述知识迁移损失和知识迁移损失的第三系数对所述合作学生模型中的高层次CNN进行优化,直至满足停止条件;
其中,所述第三系数大于所述第一系数。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述多通道信号包括两个不同头皮位置的脑电信号、一个水平眼电信号、一个下颚处肌电信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010963626.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种颗粒物料预熔式挤出机
- 下一篇:一种基于位运算的软件防抖方法和装置