[发明专利]用于IT系统应用考评拓展平台的数据完整性确定方法无效
申请号: | 201110099705.X | 申请日: | 2011-04-20 |
公开(公告)号: | CN102156922A | 公开(公告)日: | 2011-08-17 |
发明(设计)人: | 朱韵攸;李永红;陈彬武 | 申请(专利权)人: | 重庆市电力公司綦南供电局 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/00 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 江雪 |
地址: | 401420 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于IT系统应用考评拓展平台的数据完整性确定方法,包括计算空值、确定字段必要性和计算不完整的记录三个步骤,能够方便快捷地对IT系统应用考评拓展平台的数据完整性模型进行检测,有利于下一步对数据进行处理。 | ||
搜索关键词: | 用于 it 系统 应用 考评 拓展 平台 数据 完整性 确定 方法 | ||
【主权项】:
1.用于IT系统应用考评拓展平台的数据完整性确定方法,其特征在于:包括以下步骤:1)从数据库中读取数据表;2)计算数据表中一条记录字段空值:n表该表字段数,I表示第I条记录数,该条记录所有字段的数值集(向量形式):vI=(p1,p2,Λ,pn),其中pi(1≤i≤n)代表字段,字段为空的表达方式:
由此可以计算数据表中所有记录空值:m表示记录总数,采用二维数组来表达各条记录字段,则所有记录字段的数值集:v1=(p11,p12,Λ,p1n),v2=(p21,p22,Λ,p2n),
vm=(pm1,pm2,Λ,pmn).其中
于是,所有记录字段的数值集(向量形式)组成所有记录字段矩阵:v = v 1 v 2 K v m = p 11 , p 12 , Λ , p 1 n p 21 , p 22 , Λ , p 2 n K K K K K p m 1 , p m 2 , Λ , p mn ]]> 此矩阵为0,1矩阵,且矩阵的行体现了各记录的空值情况,各列体现了各字段的的空值情况,其中,当pij=1时,pij表明的是第i条记录,第j个字段为空值;当pij=0时,pij表明的是第i条记录,第j个字段为非空值,若记:v=(c1,c2,K,cn),其中,
则cj表示第j个字段;3)确定字段必要性:根据该张数据表中所有记录该字段的空值率来确定该字段是否为必要字段,假设W为恒定字段必要性的空值率常量(或阀值),设W=1%,即该张数据表中所有记录该字段空值率小于1%,各字段的空值率可用下面的公式计算:![]()
K K K K K K K K K K K K
其中ki(1≤i≤n)代表第i个字段的空值率,表现了第i个字段的完整性,根据空值率小于W(1%)恒定值,则判断该字段为必要字段,若k2的值为0.0001,则确定为该表第第个字段为必要字段,最终得出必要字段数字集:M=(c′1,c′2,K,c′t),其中1≤t≤n;4)计算不完整的记录:满足阀值的数据表的字段完整性(必要字段率)可表示为:p 1 = t n × 100 % ; ]]> 设M = c 1 ′ , c 2 ′ K c t ′ = p 11 ′ , p 12 ′ , Λ , p 1 t ′ p 21 ′ , p 22 ′ , Λ , p 2 t ′ K K K K K p m 1 ′ , p m 2 ′ , Λ , p mt ′ = v 1 ′ v 2 ′ K v m ′ ; ]]> 其中
v′i=(p′i1,p′i2,Λ,p′it)(1≤i≤m),从必要字段矩阵
可判定各记录是否完整;其判定原则:对于数据表M,考虑其所有字段和所有记录,把有空值字段的记录称为不完整数据,无空值字段的记录称为完整数据;当记录v′i=(p′i1,p′i2,Λ,p′it)=(0,0,Λ,0,)(1≤i≤m)时,v′i为完整记录,否则,vi为不完整记录。设数据表M中的记录总数为m,所有完整数据(或记录)的总数为s,则完整性模型可表示为:完整性模型或绝对完整率:p 2 = s m × 100 % . ]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆市电力公司綦南供电局,未经重庆市电力公司綦南供电局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110099705.X/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理