[发明专利]一种基于信息增益权重的增量聚类方法及装置在审
申请号: | 202110123316.X | 申请日: | 2021-01-28 |
公开(公告)号: | CN112766403A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 张子瑛;杨强;陈晓科;范颖;梁敏玲 | 申请(专利权)人: | 广东电网有限责任公司电力科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈旭红;吕金金 |
地址: | 510080 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 增益 权重 增量 方法 装置 | ||
1.一种基于信息增益权重的增量聚类方法,其特征在于,包括:
根据初始数据属性特征的信息增益权重,计算各个特征的分类贡献率;
根据所述分类贡献率分别计算所述初始数据到初始聚类中心的类内距离,并将所述类内距离小于距离阈值的类进行迭代合并,得到聚类结果,所述聚类结果包括各类别的聚类中心和最大类内距离;
根据所述分类贡献率分别计算新增数据点到所述聚类中心的距离,确定最小距离和对应聚类中心;
当所述最小距离小于等于对应聚类中心的最大类内距离时,将所述新增数据点合并至所述对应聚类中心的类别内,当所述最小距离大于对应聚类中心的最大类内距离时,则确定为一个单独类别。
2.根据权利要求1所述的基于信息增益权重的增量聚类方法,其特征在于,所述初始数据属性特征的信息增益权重根据初始数据的信息熵确定。
3.根据权利要求2所述的基于信息增益权重的增量聚类方法,其特征在于,所述各个特征的分类贡献率∝i根据下述公式确定:
其中W(T)为属性特征T的信息增益权重。
4.根据权利要求1所述的基于信息增益权重的增量聚类方法,其特征在于,所述根据所述分类贡献率分别计算所述初始数据到初始聚类中心的类内距离,具体为:
5.根据权利要求1所述的基于信息增益权重的增量聚类方法,其特征在于,对初始数据属性的连续值进行离散化处理。
6.根据权利要求1所述的基于信息增益权重的增量聚类方法,其特征在于,所述距离阈值包括初始数据到初始聚类中心的类内距离中最小的类内距离。
7.一种基于信息增益权重的增量聚类装置,其特征在于,包括:
第一初始化单元,用于根据初始数据属性特征的信息增益权重,计算各个特征的分类贡献率;
第二初始化单元,用于根据所述分类贡献率分别计算所述初始数据到初始聚类中心的类内距离,并将所述类内距离小于距离阈值的类进行迭代合并,得到聚类结果,所述聚类结果包括各类别的聚类中心和最大类内距离;
数据计算单元,用于根据所述分类贡献率分别计算新增数据点到所述聚类中心的距离,确定最小距离和对应聚类中心;
数据聚类单元,用于当所述最小距离小于等于对应聚类中心的最大类内距离时,将所述新增数据点合并至所述对应聚类中心的类别内,当所述最小距离大于对应聚类中心的最大类内距离时,则确定为一个单独类别。
8.根据权利要求7所述的基于信息增益权重的增量聚类装置,其特征在于,所述初始数据属性特征的信息增益权重根据初始数据的信息熵确定。
9.根据权利要求7所述的基于信息增益权重的增量聚类装置,其特征在于,所述距离阈值包括初始数据到初始聚类中心的类内距离中,最小的类内距离。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至6任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司电力科学研究院,未经广东电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110123316.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置