[发明专利]基于神经网络的电子图像文件自动分类方法有效
申请号: | 202010644228.X | 申请日: | 2020-07-07 |
公开(公告)号: | CN111767418B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 李保印;刘涛;张宝玉;张亮亮 | 申请(专利权)人: | 中电万维信息技术有限责任公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/084;G06N3/0499;G06F16/55;G06F16/11 |
代理公司: | 兰州嘉诺知识产权代理事务所(普通合伙) 62202 | 代理人: | 李冉冉 |
地址: | 730000 甘肃省兰州市城关*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 电子 图像文件 自动 分类 方法 | ||
本发明涉及电子文档技术领域,特别涉及基于神经网络的电子图像文件自动分类方法。本文关键技术点是将电子文档按照本文的方法进行归类,作为了神经网络的输入参数,根据神经网络BP算法,就会自动计算输出结果,再根据实际结果和计算输出结果,根据BP算法,反向对神经网络进行优化。其中神经网络整个的优化过程和反向学习过程才用传统技术,本发明核心是设计了一套电子文档的归类方式,使其能满足了神经网络分类、识别,解决了原来无法自动分类识别的难题。
技术领域
本发明涉及电子文档技术领域,特别涉及基于神经网络的电子图像文件自动分类方法。
背景技术
近年来,由于大数据、云计算、神经网络等技术蓬勃发展,出现了巨大的技术飞跃,这无疑为电子文件自动分类技术的发展提供了难得的发展机遇。在当前人工智能领域的前沿技术中,深度学习在诸多分类任务中取得了很好的效果。如何将电子图像运用到电子文件的管理中,帮助实现电子文件的自动分类,以此提升电子图像信息管理工作的效率。
发明内容
本发明将电子图像文件通过分析神经网络与电子图像文件自动分类相结合解决现有技术的不足,以促进信息管理工作中电子文件自动分类技术的发展。
本发明解决其技术问题所采用的技术方案为:
基于神经网络的电子图像文件自动分类方法,包括如下步骤:
A、配置神经网络
神经网络分为输入层,隐含层和输出层,每一层的节点都与下一层的所有节点相互连接,信号由输入层进入人工神经网络,依次向隐含层顺向传播,直至输出层;
B、数据归一化分类
将图像所包含的信息分为3个层级,分为特征层、对象层、语义概念层;特征层包括颜色、形状、纹理,对象层包括图像中对象、对象之间的空间关系,语义概念层包括场景、行为、主观感受,上述8个参数作为神经网络的输入项;
特征层的颜色分为红、黄、蓝;
特征层的形状分为圆形、长方形、正方形、平行四边形、三角形、梯形、圆柱、圆锥、球形、长方体、正方体和其他;
特征层的纹理分为条线为和非条线;
对象层的图像中对象分为人、动物、植物和其他;
对象层的对象之间的空间关系分为相连、连通和其他;
语义概念层的场景分为人与人、人与事、人与时、事与事和其他;
语义概念层的行为分为意志行为、娱乐消遣行为、行为类别间的联系、各行为类别意志特征;
语义概念层的主观感受分为友好性、易用性、有用性和其他;
C、电子图像文件选取
采用了5000张电子图像为测试数据分别按步骤B分类,其中随机选择3000张组成训练集,用于对模型进行训练;再随机选择1000张组成验证集,用于辅助模型构建;最后1000张组成测试集,用于对训练结果进行测试;
D、分析优化
先利用训练集、验证集的图片对模型进行训练及构建,其中输入层为图像的原始像素,输出层为不同类别的数据归一化分类;最后利用测试集中的图片对训练好的模型进行测试;待通过神经网络经典BP算法,对神经网络连接权值进行优化后,得到最终的识别网络,用识别网络来对电子图像文件进行分类。
所述步骤C中图像数据均来源于华中师范大学档案馆的图像数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电万维信息技术有限责任公司,未经中电万维信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644228.X/2.html,转载请声明来源钻瓜专利网。