[发明专利]残缺数据深度学习神经网络方法、装置、计算机设备及存储介质有效
申请号: | 201711205193.4 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108197706B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 朱定局 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G16H50/20 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 残缺 数据 深度 学习 神经网络 方法 装置 计算机 设备 存储 介质 | ||
1.一种深度学习神经网络方法,所述方法包括:
获取预先训练好的深度学习神经网络;具体地,根据样本输入变量与样本输出变量从深度学习网络库中选择综合匹配度最高的深度学习神经网络作为即将运用于实际项目的深度学习神经网络;用户样本数据中存储有多组数据,也就是用户样本数据中存储有多组用户数据,并不是每组用户数据都是完整的,这部分缺少数据的用户数据可以用于对深度学习神经网络进行无监督训练;对初始化后的深度学习神经网络进行训练;输入变量包括用户身体的检查数据;输出变量包括用户的疾病类型;
从待预测数据中获取输入数据;
根据所述输入数据和所述预先训练好的深度学习神经网络的输入变量确定至少一个缺少数据的输入变量;具体地,预先训练好的深度学习神经网络有N个输入变量;待预测数据中有其中M个输入变量对应的数据,其余N-M个输入变量没有对应的数据,则这N-M个输入变量是缺少数据的输入变量;其中,M、N是自然数;
将对所述缺少数据的输入变量进行赋值获得的数据,与从所述待预测数据中获取的输入数据进行组合,生成多组完整输入数据;
将所述多组完整输入数据输入到所述预先训练好的深度学习神经网络中,计算得到多组输出数据;具体地,通过知识库中存储的数据获取到缺少输入数据的取值范围后,在此取值范围内取预定数量的数据,将选取的数据赋值给缺数据的输入变量;预定数量是预先设置的数量值,可根据不同的输入变量设定不同的预定数量;选择预定数量个数量的数据对缺少数据的输入变量进行赋值,就能得到预定数量个缺少数据的输入变量的输入数据,再将填入了数据的缺少数据的输入变量与从待预测数据中获取的输入数据进行组合,生成多组完整的输入数据;再将多组完整的输入数据输入到预先训练好的深度学习神经网络中,则能够获得多个输出数据;
统计所述多组输出数据中各类输出数据所占的比例;将比例最高的一类输出数据作为预测结果;将预测结果及各类输出数据及其相应比例输出给用户;具体地,将多个输出数据及其对应比例输出给用户,作为不完整输入数据的输出数据;将最高比例对应的输出数据输出给用户,作为不完整输入数据的最大概率输出数据;
所述将对所述缺少数据的输入变量进行赋值获得的数据,与从所述待预测数据中获取的输入数据进行组合,生成多组完整输入数据,包括:
对缺少数据输入变量在对应的预设取值范围内随机地生成预定数量个值对缺少数据的输入变量进行第一预定数量次赋值;第一预定数量由用户输入或预先设置;其中,知识库中存储有多组数据,其中包括有多组与预先训练好的深度学习神经网络输入数据;可通过知识库中存储的数据获取到缺数据输入数据的取值范围;
或者
从样本数据库中随机选取预定数量个训练输入数据,然后提取这预定数量个训练输入数据中该输入变量对应的数据对缺少数据输入变量进行第二预定数量次赋值。
2.根据权利要求1所述的方法,其特征在于,在所述对缺少数据输入变量在对应的预设取值范围内随机地生成预定数量个值对缺少数据的输入变量进行第一预定数量次赋值之前,所述方法还包括:
从输入变量范围知识库中检索出缺少数据输入变量对应的预设取值范围;其中,输入变量范围知识库预先存有所有输入变量对应的预设取值范围;或从所有训练输入数据中的每一训练输入数据中获取缺少数据输入变量的值,统计获取到的缺少数据输入变量的最大值和最小值,将从最小值到最大值之间的值范围作为缺少数据输入变量的预设取值范围;或提示并接受用户输入缺少数据输入变量的预设取值范围。
3.根据权利要求1所述的方法,其特征在于,第二预定数量由用户输入或将小于或等于样本数据库中输入数据的数量的P%作为第二预定数量,P小于或等于100,样本数据库中的输入数据都是完整的输入数据。
4.根据权利要求1所述的方法,其特征在于,在所述获取预先训练好的深度学习神经网络之前,还包括:
对深度学习神经网络进行初始化;
获取训练数据;
通过训练数据对初始化后的深度学习神经网络进行训练得到预先训练好的深度学习神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711205193.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置