[发明专利]基于主动学习的心电信号数据标注方法有效
申请号: | 201910793589.8 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110555472B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 洪申达;傅兆吉;周荣博;俞杰 | 申请(专利权)人: | 安徽心之声医疗科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/2415;G06F18/20 |
代理公司: | 合肥市长远专利代理事务所(普通合伙) 34119 | 代理人: | 金宇平 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主动 学习 电信号 数据 标注 方法 | ||
1.一种基于主动学习的心电信号数据标注方法,其特征在于,首先通过样本训练获得标注模型,然后通过标注模型F对未人工标注的心电信号数据进行模型标注;
通过样本训练获得标注模型的方法为:
首先建立标注概率模型H,用于标注每一条心电信号数据对应的预测概率,并建立用于根据预测概率计算标注结果的标注函数,然后结合标注概率模型H和标注函数建立标注模型F;
根据样本数据的人工标注对标注模型F进行训练更新,且同时更新标注概率模型H进行更新;
根据更新后的标注概率模型H计算所有未人工标注的心电信号数据的预测概率,并根据预测概率计算不确定度;获取对应的不确定度最大的nh个心电信号数据作为评估数据,根据更新后的标注模型F对评估数据进行人工标注,并对各评估数据进行人工标注;
根据人工标注与模型标注一致的评估数据占比评估标注模型F的稳定度p;通过补充样本对标注模型F和标注概率模型H进行更新,直至稳定度p达到预设阈值a;
通过补充样本对标注模型F和标注概率模型H进行更新的具体方式为:当稳定度p小于阈值a,则将评估数据作为补充样本,并通过补充样本和对应的人工标注对标注模型F和标注概率模型H进行更新;
通过样本训练获得标注模型的方法具体包括:
S1、收集心电信号数据并建立初始数据集合X={x1,x2,…xn},n表示收集的心电信号数据数量,d为每条心电信号数据的长度,c为心电信号的导联数;
S2、构建标注概率模型H,其输入为心电信号数据xi,输出为心电信号数据xi对应的预测概率zi;设置标注函数,标注函数的输入为预测概率zi,其输出为标注结果yi;结合标注概率模型H和标注函数建立标注模型F,标注模型F的输入为心电信号数据xi,输出为标注结果yi;
S3、从X中随机选取部分心电信号数据作为样本数据进行人工标注,并建立样本数据集合获得样本数据集合Xyes中每一条样本数据xj的标注结果yj并建立样本标注集合Yyes;
S4、根据样本数据集合Xyes和样本标注集合Yyes对标注模型F进行更新,并根据更新后的标注模型F的参数对标注概率模型H进行更新;
S5、对初始数据集合X中未标注的心电信号数据xk,通过当前的标注模型F进行模型标注yk,并通过标注概率模型H标注预测概率zk;计算各预测概率zk的不确定度ek,获取不确定度最大的nh个不确定度对应的心电信号数据xk作为评估数据;
S6、对评估数据进行人工标注,并统计人工标注与模型标注一致的评估数据数量ne,计算ne与nh的比值作为标注模型F的稳定度P;判断稳定度P是否大于预设的阈值a,是,则保存标注模型F;
S7、否,则将评估数据和对应的人工标注分别补充到集合Xyes和样本标注集合Yyes,然后返回步骤S4。
2.如权利要求1所述的基于主动学习的心电信号数据标注方法,其特征在于,步骤S2中,预测概率zi为由m个概率值组成的长度为m的行向量,且m个概率值之和为1;标注函数为:yi为与预测概率zi等长的行向量;yi有且仅有一个位置标注为1,其余位置为0,且yi中标注为1的位置为zi中最大值对应的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽心之声医疗科技有限公司,未经安徽心之声医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910793589.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种移动终端及目标物的搜寻方法
- 下一篇:行车线路规划方法、服务器及系统