[发明专利]异常肌肉检测方法和系统有效
申请号: | 201810682299.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN109033976B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 王念;崔莉;赵泽 | 申请(专利权)人: | 北京中科天合科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 唐海力;李志刚 |
地址: | 100190 北京市海淀区科学院南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 肌肉 检测 方法 系统 | ||
本申请公开了一种过采样处理方法。该过采样处理方法包括:获取少数类样本集合;根据邻域粗糙集算法将所述少数类样本集合划分成少数类边界区和少数类正域;以及在所述少数类边界区和所述少数类正域之间进行插值,生成合成样本。本申请基于邻域粗糙集对于少数类样本集合进行划分,并随机选择少数类边界区样本朝向少数类正域进行有向插值,从而产生更具正域模式的合成样本,以此来增加少数类样本的个数并平衡数据集,由于本申请的过采样方法没有过采样点的正确性校验,故而不存在过采样不充分的问题。本申请解决了现有过采样方法在合成过采样数据过程中存在的无法充分过采样出具有正域模式的合成样本的问题。
技术领域
本申请属于机器学习及数据预处理领域,涉及一种异常肌肉检测中的过采样的数据平衡化处理方法。
背景技术
在使用肌电信号进行异常肌肉检测时,往往需要采集大量带标签(即异常肌肉和正常肌肉)的肌电信号,并根据该数据集训练出异常肌肉的检测模型,以达到对异常肌肉识别的目的。发明人希望异常肌肉识别模型能够在未来真实的数据集上达到最好的泛化效果,但模型的泛化能力与数据集息息相关,由于现实世界中患者和正常人的不平衡分布,采集到的异常肌肉肌电数据集往往存在偏态问题,即在采集到的数据集中不同类别样本的数量存在较大差异,这种情况被称为数据不平衡。为解决数据不平衡导致的异常肌肉检测分类模型泛化能力下降问题,发明人提出了该方案。
传统机器学习的分类与预测算法假设样本集中各类样本的数量无明显差异,故而当传统机器学习方法被应用于不平衡数据集时,为了达到整体精度的最大化,分类器往往会更加关注多数类样本而忽视少数类样本,从而导致多数类样本的分类空间扩大、分类边界偏向多数类样本的现象。进而使得少数类样本难以被识别,影响分类器的性能。
为从数据集层面解决不平衡问题,人们提出了过采样方法。过采样方法通过对少数类样本集合中的数据进行处理,从而使少数类样本集合与多数类样本集合中的数据数量达到平衡,常见的过采样方法通过拷贝少数类样本或生成新的少数类样本(合成样本)的方法来达到平衡数据集合。在过采样方法中,最简单的做法是直接复制少数类样本,但这种做法只会引起少数类样本数量的变化,并未引起质的变化,不能真正提高少数类样本的分类属性。在现有技术中的过采样方法中,过采样出的合成样本具有随机性,它们的分布太过分散,缺少该类样本典型模式,这可能会影响后续分类器的泛化能力,且可能出现采样率不足的问题。
针对现有技术的过采样方法中的缺少典型样本以及采样率不足的问题,发明人提出了一种解决方案。
申请内容
本申请的主要目的在于提供一种异常肌肉检测方法,以解决现有过采样方法在合成过采样数据过程中存在的无法充分过采样出具有正域模式的合成样本的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种异常肌肉检测方法,包括:获取第一少数类样本集合;根据邻域粗糙集算法将所述第一少数类样本集合划分成少数类边界区和少数类正域;在所述少数类边界区和所述少数类正域之间进行插值,生成合成样本。
进一步的,该异常肌肉检测方法,还包括:根据所述第一少数类样本集合以及所述合成样本,生成第二少数类样本集合;判断所述第二少数类样本集合的样本数量是否与多数类样本集合的样本数量相对应;若否,则继续在所述少数类边界区和所述少数类正域之间进行插值,生成合成样本,并将该合成样本加入所述第二少数类样本集合,直至所述第二少数类样本集合的样本数量与多数类样本集合的样本数量相对应。
进一步的,所述在所述少数类边界区和所述少数类正域之间进行插值,生成合成样本,包括:在所述少数类边界区中随机选取至少一个第一样本;在所述少数类正域中随机选取至少一个第二样本;在所述第一样本和所述第二样本组成的区域内随机插值,生成至少一个合成样本。
进一步的,当所述第二少数类样本集合的样本数量与多数类样本集合的样本数量相对应时:根据所述多数类样本集合以及所述第二少数类样本集合,生成平衡数据集合;输出所述平衡数据集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科天合科技有限公司,未经北京中科天合科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810682299.1/2.html,转载请声明来源钻瓜专利网。