[发明专利]一种基于深度学习测试数据集的数据质量多维评估技术在审
申请号: | 202010712771.9 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111858346A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 陈振宇;尹伊宁;高新宇 | 申请(专利权)人: | 深圳慕智科技有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 测试数据 数据 质量 多维 评估 技术 | ||
1.一种基于深度学习测试数据集的数据质量多维评估方法,其特征是基于深度神经网络的测试集度量评估,给出测试集输入输出两个层次的度量,输入维度模块,一致性维度模块,输出维度模块;本发明的输入为深度学习测试数据集,根据数据集具体结构和信息,结合所使用的神经网络,对数据集质量进行多维评估,并最终生成测试数据集的质量报告。
2.根据权利要求1中的输入维度模块,其特征是,对深度学习数据集的整体结构进行把握和评估;分别针对数据集子集结构一致性,数据集内部多样性两个方面;利用不同的度量算子,计算用于深度学习测试的数据集标签层面均匀分布程度与标签内部层面均匀分布程度。
3.根据权利要求1中的一致性模块,其特征是,通过考察训练与测试数据集基于不同的分布的一致性偏差,避免测试过程中的固有误差影响到深度学习测试过程,从而导致不良的后果。
4.对于权利要求1中的输出模块,其特征是,利用拓扑数据分析的思想,建立输出层测试集数据结构的拓扑信息分析度量;从模型在持续同调性上所反映出的拓扑结构的产生与消亡信息出发,建立针对深度学习输出层(Softmax层)的高维点云数据的低维拓扑结构的稳定性度量,并提出全新的“拓扑结构寿命”维度度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳慕智科技有限公司,未经深圳慕智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010712771.9/1.html,转载请声明来源钻瓜专利网。