[发明专利]基于语义定义的目标识别网络设计方法有效
申请号: | 201810465726.0 | 申请日: | 2018-05-16 |
公开(公告)号: | CN108764459B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 石光明;谢雪梅;高大化;毛思颖;马丽华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/06 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 定义 目标 识别 网络 设计 方法 | ||
本发明提出了一种基于语义定义的目标识别网络设计方法,主要解决现有目标识别网络需要大数据驱动,能耗高,费时间,泛化能力和迁移性弱的问题。其实现方案是:1.定义语义的层级化结构以及基于人类感觉的语义基元;2.根据人类初级视皮层V1的视觉神经元分别设计不同类型的可以执行不同功能的基层语义神经元,分别负责检测水平线、垂直线、斜线、直线、弧线、三角形、四边形、多边形和颜色;3.按照需要识别目标的层级语义,逐层构建语义识别网络;4.用语义识别网络对图片进行识别。本发明是基于脑启发的,不需要大数据驱动,能耗低,并具有很高的泛化能力和迁移性,可用于对多种目标的识别。
技术领域
本发明属于人工智能领域,主要涉及一种新的目标识别网络,可用于对多类目标进行识别。
背景技术
当今信息技术的巨大进步推动着人工智能的基础理论、方法和技术向纵深发展。随着信息技术、大数据、深度学习,脑神经科学的巨大进步,推动着人工智能技术的再一次飞跃。人工智能正呈现出以信息和知识处理为主、与人类知识混合、能自主完成更多认知性工作等新特点。
近年来,随着人工智能领域研究工作的快速发展,越来越多基于深度学习算法的神经网络在计算机视觉、语音识别、自然语言处理等方面取得了优异成绩,特别是在计算机视觉的目标识别领域,比如:VGGNet、InceptionNet、ResNet等网络,它们都是使用较小的卷积核和较深的网络结构。这些网络虽然可以有效地提取到图像的显著性特征,在目标识别任务上也取得了很不错的成绩。但是,目前这些基于深度学习的目标识别网络都是由一套共同的工作机制运行的,且只能用数学函数来刻画约束规则,根据该约束规则,网络才能通过前向传播和反向调权进行精准计算,以拟合求出误差最小的解,这套固定的工作模式会带来如下几个不足:
1.网络的训练依靠大数据驱动,需要大量的标注数据以及繁琐的调参过程,且数据存储和计算相互独立,数据传输占很大比例,导致存储及计算复杂,耗能很高。
2.网络存在“难设计、难预期、难解释”的三难问题。
3.网络缺乏迁移学习和泛化能力,即只能完成单一任务而不是多任务,对于同一类物体在不同情况下的样本适应能力差,比如做人脸识别的就只能识别人脸、并且针对正面的脸识别效果好,如果脸稍稍偏一点就无法识别或识别效果不好。
发明内容
本发明的目的在于提出一种基于语义定义的目标识别网络设计方法,以解决上述现有目标识别网络的不足,减小存储、计算复杂度和耗能,提高迁移学习和泛化能力,实现快速有效的目标识别。
本发明的技术思想是:通过目标语义知识定义构造一个全新的网络,以将人类获得的目标信息直接注入到计算机帮助计算机识别目标。
根据上述思想,本发明基于语义定义的目标识别网络设计方法,其特征在于:包括:
1)定义语义及语义基元:
语义是由多个子语义组合,每个子语义又由子子语义组合,以此类推,直至最底层的语义基元而构成的层级结构;
语义基元,是指视觉、听觉、嗅觉、味觉、触觉这几种人类最基本的感觉信息;不同的语义基元之间存在关联性;
2)设计各类基元滤波器:
2a)根据人类初级视皮层v1的神经元分别设计不同类型,并能执行不同功能的基元滤波器,用于对输入的预处理图像进行滤波,检测出不同的视觉语义基元,该视觉语义基元包括:点、水平线、垂直线、斜线、弧线、三角形、四边型、多边形、圆、圆弧、颜色;
2b)根据基元滤波器与预处理图像块的匹配程度,使得基元滤波器的输出为0或1,或0到1之间的某个小数,并转换成相应幅值的脉冲输入到下一层;
3)构建语义识别网络:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810465726.0/2.html,转载请声明来源钻瓜专利网。