[发明专利]基于语义定义的目标识别网络设计方法有效
申请号: | 201810465726.0 | 申请日: | 2018-05-16 |
公开(公告)号: | CN108764459B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 石光明;谢雪梅;高大化;毛思颖;马丽华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/06 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 定义 目标 识别 网络 设计 方法 | ||
1.基于语义定义的目标识别网络设计方法,其特征在于,包括:
1)定义语义及语义基元:
语义是由多个子语义组合,每个子语义又由子子语义组合,以此类推,直至最底层的语义基元而构成的层级结构;
语义基元,是指视觉、听觉、嗅觉、味觉、触觉这几种人类最基本的感觉信息;不同的语义基元之间存在关联性;
2)设计各类基元滤波器:
2a)根据人类初级视皮层v1的神经元分别设计不同类型,并能执行不同功能的基元滤波器,用于对输入的预处理图像进行滤波,检测出不同的视觉语义基元,该视觉语义基元包括:点、水平线、垂直线、斜线、弧线、多边形、圆、圆弧和颜色;
2b)根据基元滤波器与预处理图像块的匹配程度,使得基元滤波器的输出为0或1,或0到1之间的某个小数,并转换成相应幅值的脉冲输入到下一层;
3)构建语义识别网络:
3a)用不同的基元滤波器对输入的预处理图像进行滤波,得到含语义基元的图像,再从该图像中提取出相应的语义基元,以形成语义识别网络的底层;
3b)按照所需识别的目标信息将底层不同的语义基元进行纵向组合,抽象成高于底层的语义,形成语义识别网络第二层,再从第二层出发,抽象成高于第二层的语义,形成语义识别网络第三层,以此类推,再进一步组合到语义识别网络更高的层,直到顶层形成目标语义;
3c)根据语义基元之间的相对空间位置关系在底层加入侧向连接,并在网络各个层之间进行跨层连接,其中语义基元间的空间位置关系包括:上下、左右、交叉、包容和前后;
3d)将网络中每一类目标的语义信息载体定义为语义神经元,按照层级方式将每一类目标的语义神经元并行排列,形成能识别多类目标的语义识别网络;
4)语义识别网络的识别过程:
将预处理后的图像输入到语义识别网络,在网络中用表示第i层的第t个语义神经元,则每一个语义神经元的输出由其上一层语义神经元输入的加权形式表示为:
其中,i=1,2,...,n,n是网络的总层数,K(i-1)为第i-1层中的所有语义神经元的集合,为对应于第i-1层第t个语义神经元的权重系数;
当i=1时表示网络的第一层,该层语义神经元即基元滤波器对输入的预处理图像进行滤波提取出语义基元输入到第二层,激活第二层相关的语义神经元,再提取出第二层相应的语义信息输入到第三层,激活第三层相关的语义神经元,以此类推,直到逐层激活所有相关的语义神经元;
当i=n时,在顶层相应的语义神经元上输出识别的结果。
2.根据权利要求1所述的方法,其中步骤1)中的视觉、听觉、嗅觉、味觉、触觉的基本感觉信息,分别描述如下:
所述视觉,该基本感觉信息包括:形状、对比度、饱和度和颜色;
所述听觉,该基本感觉信息包括:音调、音量和音色;
所述嗅觉,该基本感觉信息包括:香水味、松香味、水果香味、腐臭味和焦臭味;
所述味觉,该基本感觉信息包括:甜、酸、苦和咸;
所述触觉,该基本感觉信息包括:温度、湿度、疼痛、压力和振动。
3.根据权利要求2所述的方法,所述的形状,包括:点、线、面和立体结构。
4.根据权利要求2所述的方法,所述的颜色,包括:红、橙、黄、绿、青、蓝、紫、黑和白。
5.根据权利要求1所述的方法,其中步骤3a)中用不同的基元滤波器对输入的预处理图像进行滤波,得到含语义基元的图像,按如下步骤进行:
3a1)输入大小为M×M的图像,经过预处理成二值轮廓边缘图像后,将其划分成N×N的图像块,每个块的大小为其中M≥1,N≥1;
3a2)分别设计能够检测水平线、竖线、斜线、弧形的空间滤波器,构成四类检测线条的基元滤波器;
3a3)将每一类基元滤波器分别按行和列排成方阵,调整其大小使其与3a1)获得的图像块相匹配;
3a4)遍历整个图像对所有匹配的图像块进行滤波,得到只含有相应语义基元的图像。
6.根据权利要求4所述的方法,其中步骤3a2)中设计的基元滤波器,还包括多边形和圆形,用于对复杂图像的空间滤波。
7.根据权利要求1所述的方法,其中步骤2b)中根据基元滤波器与预处理的图像块的匹配程度,使得基元滤波器的输出为0或1,或0到1之间的某个小数,按如下规则进行:
当基元滤波器与图像块内的目标完全匹配时,即基元滤波器提取的语义基元与图像块中的信息完全一致,则基元滤波器的输出为1;
当基元滤波器与图像块内的目标完全不匹配时,即基元滤波器提取的语义基元与图像块中的信息完全不一致,则基元滤波器的输出为0;
当基元滤波器与图像块内的目标不完全匹配时,即基元滤波器提取的语义基元与图像块中的信息不完全一致,则基元滤波器的输出为0到1之间的数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810465726.0/1.html,转载请声明来源钻瓜专利网。