[发明专利]一种基于改进kNN算法的非侵入式负荷辨识方法在审
申请号: | 202111201436.3 | 申请日: | 2021-10-15 |
公开(公告)号: | CN114004285A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 王新迪;卞海红;潘柯言;王新策;房可 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京源古知识产权代理事务所(普通合伙) 32300 | 代理人: | 马晓辉 |
地址: | 211167 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 knn 算法 侵入 负荷 辨识 方法 | ||
本发明提供了一种基于改进kNN算法的非侵入式负荷辨识方法,包括以下步骤:步骤S01:选择V‑I轨迹作为负荷特征,提取轨迹特征,在提取轨迹特征中增加幅值特征;步骤S02:改进KNN算法,在KNN算法中为训练样本分配不同的权重,增加少数类样本在分类判决时的表决权,步骤S03:在步骤S01提取了二值V‑I轨迹和幅值两种负荷特征,引入综合相似度概念,利用步骤S02改进的KNN算法,将两种负荷特征相结合,确定待测样本的类别对负荷进行辨识。本发明在数据集不平衡的情况下,通过增加权重的方式,提高与多数类具有相似V‑I轨迹形状的少数类样本的识别准确率,提高了前端电路拓扑相同但功率等级不同的两类用电设备的识别准确率。
技术领域
本发明涉及一种基于改进kNN算法的非侵入式负荷辨识方法。
背景技术
kNN算法通过比较待测样本与大量训练样本的相似度来为待测样本分类,其核心思想是挑选出与待测样本最相近的K个样本,若待测样本与这K个训练样本中某一类的总相似度最大,则将待测样本划分为这一类别。
kNN算法的缺点在于当数据集存在不平衡问题时,样本数量较多的多数类训练样本容易被选为K最近邻,对少数类的判决造成干扰。
发明内容
1.所要解决的技术问题:
现有kNN算法存在着当数据集存在不平衡问题时,样本数量较多的多数类训练样本容易被选为K最近邻,对少数类的判决造成干扰的问题。
2.技术方案:
为了解决以上问题,本发明提供了一种基于改进kNN算法的非侵入式负荷辨识方法,包括以下步骤:步骤S01:选择V-I轨迹作为负荷特征,提取轨迹特征,在提取轨迹特征中增加幅值特征;步骤S02:改进KNN算法,在KNN算法中为训练样本分配不同的权重,增加少数类样本在分类判决时的表决权,步骤S03:在步骤S01提取了二值V-I轨迹和幅值两种负荷特征,引入综合相似度概念,利用步骤S02改进的KNN算法,将两种负荷特征相结合,确定待测样本的类别对负荷进行辨识。
所述幅值特征包括用电设备稳态运行时的基波有功、无功功率、基波电流幅值和3、5、7次谐波电流幅值。
在增加幅值特征的情况下,对电压和电流进行快速傅里叶变换即可得基波和各次谐波的幅值与相位,功率的计算公式如下:其中:a1和b1分别为基波电压和电流的幅值;为两者之间的的相位差。
步骤S02中,改进后的KNN算法具体为:
其中:weight(Tj)为训练样本Tj的权重。
多数类样本权重分配方法如下:其中size(CTj)表示Tj所属类别包含的训练样本数目。
步骤S03具体为:步骤S031:计算待测样本与所有训练样本的V-I轨迹相似度和幅值相似度,分别记为Sim1和Sim2:其中:dist1和dist2分别为2个样本间V-I轨迹的距离和幅值的距离;步骤S032:按照Sim1的大小降序排列,取前K个Sim1最大的训练样本作为当前测试样本的K最近邻;步骤S033:计算当前测试样本与所有K最近邻的综合相似度:Sim(a,Tj)=Sim 1(a,Tj)×weight(Tj)+Sim 2(a,Tj);
步骤S034:统计待测样本与K个最近邻中各类的总综合相似度,取总综合相似度最大的类作为预测结果。
所述dist1和dist2都是欧氏距离。
3.有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111201436.3/2.html,转载请声明来源钻瓜专利网。