[发明专利]一种基于深度学习的自动视觉编码方法在审
申请号: | 202210327686.X | 申请日: | 2022-03-30 |
公开(公告)号: | CN114896476A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 刘佳;万刚 | 申请(专利权)人: | 中国人民解放军战略支援部队航天工程大学 |
主分类号: | G06F16/904 | 分类号: | G06F16/904;G06N3/04;G06N3/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 袁瑞霞 |
地址: | 101416 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 自动 视觉 编码 方法 | ||
1.一种基于深度学习的自动视觉编码方法,其特征在于,对基础类型数据的可视化图表进行解析,提取其中的视觉编码、标尺以及坐标系并进行标注,形成有监督的视觉编码数据集;
然后利用有监督的视觉编码数据集进行模型设计、模型训练以及模型验证;预测视觉编码,实现数据到视觉通道的映射。
2.如权利要求1所述的方法,其特征在于,对基础类型数据的可视化图表进行解析的具体方式为:首先从网络中搜集各类基础数据的可视化图表作为学习的数据源,并将其进行分类,将数据分为四类:空间数据、时间数据、时空数据以及一般数据。
3.如权利要求2所述的方法,其特征在于,从网络中搜集各类基础数据时,对数据类型进行控制。
4.如权利要求1-3任意一项所述的方法,其特征在于,对于数据标注的具体方式为:首先,提取坐标系;其次,提取可视化图形的标尺即所编码数据的类型;提取图表中视觉通道所编码的数据的类型,作为此条记录的数据特征,然后提取坐标系中X轴和Y轴所编码的数据的类型,作为此条记录中X轴和Y轴的特征;最后,提取视觉编码所使用的视觉通道,作为此条数据的监督标记,由此,形成有监督的可视化数据集。
5.如权利要求4所述的方法,其特征在于,所述坐标系包括直角坐标系、极坐标系和地理坐标系;所述标尺包括用于描述数据值的数值型标尺、用于描述数据分类情况的类别型标尺以及用于描述数据变化趋势的定序型标尺。
6.如权利要求4所述的方法,其特征在于,对于模型设计的具体方式为:选择数据来源、数据类型、X轴、Y轴以及用于监督的标签,同时将这五个字段均作数值化处理;对于数据集,将数据分为70%/20%/10%训练/验证/测试集,确保三个集合之间没有重叠;
定义神经网络的深度及隐藏层的维度;输出层结果经过Softmax函数处理后,得到最终的模型结果,其中Softmax函数为其中D=max(Vi),Vi是分类器前级输出单元的输出,i表示类别索引,总的类别个数为C,Si表示的是当前元素的指数与所有元素指数和的比值;
Softmax函数将输出的神经元映射到0-1之间的实数,并且归一化保证和为1,将多分类的输出序列转化为相对概率;
针对分类问题采用交叉熵损失函数,最后使用梯度下降法来迭代损失函数,对损失函数进行反向更新,通过损失函数的导数得到反向更新的梯度。
7.如权利要求6所述的方法,其特征在于,所述模型是一个具有2个隐藏层的全连接前馈神经网络,每个层由具有ReLU激活功能的神经元组成,ReLU激活函数为f(x)=max(0,x),使用PyTorch实现模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队航天工程大学,未经中国人民解放军战略支援部队航天工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210327686.X/1.html,转载请声明来源钻瓜专利网。