[发明专利]基于数据输入行为分析的航天测试数据校核装置有效
申请号: | 201810698851.6 | 申请日: | 2018-06-29 |
公开(公告)号: | CN109033205B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 陈闪闪;李春;杨积东;张亚军;张贝格;姜丽红;蔡滨妮 | 申请(专利权)人: | 上海精密计量测试研究所 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/25;G06Q10/06;G06Q50/04 |
代理公司: | 上海航天局专利中心 31107 | 代理人: | 尹清卿 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 输入 行为 分析 航天 测试数据 校核 装置 | ||
本发明提供基于数据输入行为分析的航天测试数据校核模型,包括:序列字典构建模块,设定权值建立序列权值字典;数据采集模块,对航天电子元件测试数据文件进行解析,并做数据清洗,得到结构化数据;行为模型构建模块,结合序列权值字典对结构化数据计算序列得分,建立模型或更新已有模型;存储模块,包括文件系统和数据库;预测模块,通过比较批次数据和相应模型的匹配度得出数据批次的可靠性评估。本发明提供的基于数据输入行为分析的航天测试数据校核模型,自动将测试数据转换为数据输入行为数据,充分利用数据本身来提取行为信息,从而从行为的角度对数据的输入进行分析,以一种新颖的方式给出了对测试数据可靠性的校验结果。
技术领域
本发明涉及数据质量分析领域,特别涉及基于数据输入行为分析的航天测试数据校核模型。
背景技术
电子器件质量的可靠性和稳定性是保证航天设备研发制造的重要因素,因此电子器件产品的质量测试数据非常关键。而在实际的测试过程中,测试数据的质量很有可能受到测量人员行为的影响,一些不合规范的数据记录行为将大大影响测试数据的质量。很多时候,虚假的数据也在合理误差范围之内,这就使得它很难被发现。同时,人工对大量的测试数据进行逐条分析和检查耗时耗力不切实际。
行为分析方法是根据获得的用户行为相关数据进行分析处理,提取特征建立行为模型,从而有效的抽象化描述一类行为模式。它被广泛应用在各个领域,如目标人群定位、个性化推荐等等。对元器件测试数据,目前还是以人为的方式来录入,不同的人存在不同的记录行为,基于测试数据对人的行为做分析,建立合规行为模型,通过比较新的数据记录行为和合规模型,就可以发现数据记录过程中的不合理行为,从而得出对测试数据可靠性的判断。
对于异常数据的检测,已有的方法大多基于数据本身的偏移或是分布的不同,而少有对于数据产生过程的分析。而其中基于行为分析来检测数据记录过程的方法,往往需要时间信息。
Baigent C,Harrell F E,Buyse M等人所著的“Ensuring trial validity bydata quality assurance and diversification of monitoring methods”.Clinicaltrials,2008,5(1):49-55.对于实验数据质量的监测中,使用了缺失值检查、异常数据模式检查、数据记录频率检查等方法。除了常用的数据质量检测方法之外,数据记录频率反应数据记录者的行为,异常行为的发现,可以得出数据的不可靠性。然而对于缺少记录的时间数据,而值在合理范围内的虚假数据依旧无法检测出来。CHartgerink,J Wicherts,MV Assen所著的“The value of statistical tools to detect data fabrication”HartgerinkC,Wicherts J,Assen M V.The value of statistical tools to detect datafabrication[J].Research IdeasOutcomes,2016,2(4):e8860.提出了通过统计学的方法,对数据特征进行挖掘,从而鉴别真实数据和伪造数据的方法。但是该方法基于伪造数据和真实数据的分布存在明显偏差,对于无特定的策略制造的假数据检测力较弱。
发明内容
本发明的目的在于提供基于数据输入行为分析的航天测试数据校核模型,以解决如何建立数据记录行为模型检测数据记录过程中异常的问题。
为了解决上述技术问题,本发明的技术方案是:提出一种基于数据输入行为分析的航天测试数据校核模型,包括:序列字典构建模块,根据键盘不同键位分布以及人工输入数字的连贯性设定权值建立序列权值字典;数据采集模块,对输入的航天电子元件测试数据文件进行解析,并做数据清洗,得到结构化数据;行为模型构建模块,结合所述序列权值字典对所述结构化数据计算序列得分,根据不同批次数据所属类型及其序列得分数据建立模型或更新已有模型;存储模块,包括文件系统和数据库,所述数据库用于存储结构化的测试数据,所述文件系统用于存储计算得到的模型;预测模块,通过比较批次数据和相应模型的匹配度得出数据批次的可靠性评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海精密计量测试研究所,未经上海精密计量测试研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810698851.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置