[发明专利]一种不完整有序键值型工况数据的补充方法及转换类别集的方法在审
申请号: | 201810272563.4 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108614802A | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 陈新碧 | 申请(专利权)人: | 重庆沐信润喆网络科技有限公司 |
主分类号: | G06F17/10 | 分类号: | G06F17/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 402260 重庆市江津区双福街道*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工况数据 转换 数据转换 总数据量 全数据 数据量 补充 | ||
本发明提供一种不完整有序键值型工况数据的补充方法和转换类别集的方法,结合两种方法,它包括:获取不完整有序键值型工况数据;对不完整的工况数据进行处理;得到完整的有序键值型工况数据;获取完整的工况数据;设置M个类别集,选择M个类别集中心;计算完整的工况数据和各类别集的距离值;判断M是否等于2,若是,则类别集转换完毕;反之,则计算M个类别集中数据量占总数据量的比例;判断是否有占比超过1/2的类别集,若是,则将此类别集分为两个类别集,否则,类别集转换完毕。本发明能够在面对数据不完整的情况下,将不完整有序键值型工况数据补全,以及将全部补全后的数据转换为类别集;能提高补全数据的准确性以及转换成类别集的完整性。
技术领域
本发明涉及工况数据处理技术领域,特别是一种不完整有序键值型工况数据补充方法及转换类别集的方法。
背景技术
在现有的数据采集过程中,由于数据测量的误差、数据获取的限制,以及对数据的理解有偏差等原因,使得数据集中的某些样本缺失。例如考古中对文物的描述可能会模糊不清,或是有的记录项无法获得;工业上采集数据时,可能会因为环境等问题使采集数据失败,数据的测量存在较大误差或者得到带有随机噪声的数据,这些都可能会导致现场数据中某些属性缺失。如果数据是不完整的,常常会影响到下一步的工作,所以对不完整数据的处理时很重要的,同时也是比较复杂的。
对于采集到的工况数据,由于技术原因,很难获取到完整的数据。其中也就包括了键值型数据。对不完整数据集转换为类别集时,第一步是要将不完整有序键值型工况数据补全,然后再将完整的键值型工况数据转换成类别集。
因此需要一种当键值型工况数据不完整时依旧能够将其转换成类别集的方法。
发明内容
本发明的一个目的就是提供一种不完整有序键值型工况数据的补充方法,它将不完整有序键值型工况数据补全。
本发明的目的是通过这样的技术方案实现的,具体步骤如下:
S1:获取不完整有序键值型工况数据;
S2:对不完整有序键值型的工况数据进行处理;
S3:得到完整的有序键值型工况数据;
所述步骤S2中的处理包括有:
S21:作出有序键值与频率对应的二维图谱;
S22:根据二维图谱计算得到拟合曲线,确定极小值;
S23:从原始数据或者最小值开始,将极小值点划为一个区域,直至最大值,共划分N个区域;
S24:计算每个区域内,两两键值之差;
S25:针对这N个区域,分别求取每个区域的补全值;
S26:根据步骤S25中求取的补全值对该段数据进行补充。
进一步,所述步骤S22计算得到拟合曲线的方法为:
根据最小二乘法计算出不完整有序键值工况数据与频率之间的拟合曲线;
当处理复杂数据时,针对数据的复杂程度,分多段使用最小二乘法拟合曲线。
进一步,所述步骤S23还包括有:
S231:从小有序键值型数据到最大有序键值型数据依次划分端点作为区域划分的界限;
S232:连续曲线上遇极小值则取极小值作为一个端点,依次取得N-1个端点,作为有序键值型数据划分N段区域的依据;
S233:计算复杂数据时,分多段使用最小二乘法进行拟合,此时断点即作为一个端点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆沐信润喆网络科技有限公司,未经重庆沐信润喆网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810272563.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子芯片的数据驳接模块
- 下一篇:一种气象数据质量控制方法及系统