[发明专利]一种不完整有序键值型工况数据转换类别集的方法在审
申请号: | 201810271212.1 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108491532A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 张可;柴毅;游丹妮;李媛;程传阳 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 胡柯 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工况数据 转换 数据转换 总数据量 全数据 数据量 | ||
本发明公开了一种不完整有序键值型工况数据转换类别集的方法,它包括:获取不完整有序键值型工况数据;对不完整的工况数据进行处理;得到完整的有序键值型工况数据;获取完整的工况数据;设置M个类别集,选择M个类别集中心;计算完整的工况数据和各类别集的距离值;判断M是否等于2,若是,则类别集转换完毕;反之,则计算M个类别集中数据量占总数据量的比例;判断是否有占比超过1/2的类别集,若是,则将此类别集分为两个类别集,否则,类别集转换完毕。本发明取得的有益效果是:能够在面对数据不完整的情况下,将不完整有序键值型工况数据补全,以及将全部补全后的数据转换为类别集;能提高补全数据的准确性以及转换成类别集的完整性。
技术领域
本发明涉及工况数据处理技术领域,特别是一种不完整有序键值型工况数据转换类别集的方法。
背景技术
在现有的数据采集过程中,由于数据测量的误差、数据获取的限制,以及对数据的理解有偏差等原因,使得数据集中的某些样本缺失。例如考古中对文物的描述可能会模糊不清,或是有的记录项无法获得;工业上采集数据时,可能会因为环境等问题使采集数据失败,数据的测量存在较大误差或者得到带有随机噪声的数据,这些都可能会导致现场数据中某些属性缺失。如果数据是不完整的,常常会影响到下一步的工作,所以对不完整数据的处理时很重要的,同时也是比较复杂的。
对于采集到的工况数据,由于技术原因,很难获取到完整的数据。其中也就包括了键值型数据。对不完整数据集转换为类别集时,第一步是要将不完整有序键值型工况数据补全,然后再将完整的键值型工况数据转换成类别集。
因此需要一种当键值型工况数据不完整时依旧能够将其转换成类别集的方法。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种不完整有序键值型工况数据转换类别集的方法,能够在面对数据不完整的情况下,将不完整有序键值型工况数据补全,以及能够将补全后的数据转换为类别集;能提高补全数据的准确性以及转换成类别集的完整性。
本发明的目的是通过这样的技术方案实现的,一种不完整有序键值型工况数据转换类别集的方法,它包括有:对不完整有序键值型工况数据近似完整的补充,即:
S1:获取不完整有序键值型工况数据;
S2:对不完整有序键值型的工况数据进行处理;
S3:得到完整的有序键值型工况数据;
和,将键值型数据转换为类别集的方法,即:
S4:获取步骤S3中完整的有序键值型工况数据;
S5:设置M个类别集,并选择M个类别集中心;
S6:根据距离相异度最小原则,计算完整的键值型工况数据和每个类别集原型之间的距离值;
S7:将完整的键值型工况数据划入距离值最小的第i个类别集原型;
S8:判断M是否等于2,若是,则进行步骤S10;反之,若不等于2,则计算M个类别集中包含的数据量占总数据量的比例;
S9:判断是否有占比超过1/2的类别集,如果是,则将此类别集分为两个类别集,并返回步骤S6;如果否,则进行步骤S10;
S10:类别集转换完毕。
进一步,所述步骤S2中的处理包括有:
S21:作出有序键值与频率对应的二维图谱;
S22:根据二维图谱计算得到拟合曲线,确定极小值;
S23:从原始数据或者最小值开始,将极小值点划为一个区域,直至最大值,共划分N个区域;
S24:计算每个区域内,两两键值之差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271212.1/2.html,转载请声明来源钻瓜专利网。