[发明专利]用于提高利用边缘损失来检测事件的分割性能的方法装置有效
申请号: | 201911055501.9 | 申请日: | 2019-10-31 |
公开(公告)号: | CN111488880B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 金桂贤;金镕重;金寅洙;金鹤京;南云铉;夫硕焄;成明哲;吕东勋;柳宇宙;张泰雄;郑景中;诸泓模;赵浩辰 | 申请(专利权)人: | 斯特拉德视觉公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/44;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 金美莲 |
地址: | 韩国庆*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提高 利用 边缘 损失 检测 事件 分割 性能 方法 装置 | ||
本发明涉及用于提高利用边缘损失来检测事件的分割性能的方法装置。提供一种用于提高分割性能的学习方法,该分割性能用于检测行人事件、汽车事件、掉下事件、掉落事件等事件。所述方法包括以下步骤:所述学习装置(a)使k个卷积层生成k个编码特征映射;(b)使(k‑1)个反卷积层依次生成(k‑1)个解码特征映射,所述学习装置使h个掩膜层参考从与其对应的h个反卷积层输出的h个基本解码特征映射以及从所述h个基本解码特征映射中提取边缘部分来生成的h个边缘特征映射;以及(c)使h个边缘损失层参考所述边缘部分和与其对应的GT来生成h个边缘损失。另外,所述方法可以增加检测交通标志、地标和道路标志的程度。
技术领域
本发明涉及一种用于提高分割性能的学习方法,该分割性能用于检测行人事件、汽车事件、掉下事件(有物品从行驶中的车辆掉下来的事件)、掉落事件(物品掉落到道路上)等事件,更具体地说,涉及以下学习方法及学习方法以及利用其的测试方法及测试装置,所述学习方法用于使用学习装置来提高分割性能,其中,所述学习装置包括:(i)第一至第k卷积层,对与至少一个训练图像对应的至少一个特征映射执行一次以上的卷积运算,分别输出第一至第k编码特征映射;(ii)第(k-1)至第一反卷积层,对所述第k编码特征映射执行至少一次反卷积运算,分别输出第(k-1)至第一解码特征映射;(iii)第一至第h掩膜层,分别与所述(k-1)个反卷积层中的h个反卷积层对应,其中,所述h是1到(k-1)的整数;以及(iv)第一至第h边缘损失层,分别与所述第一至所述第h掩膜层对应,所述学习方法包括以下步骤:(a)如果被输入所述训练图像,则所述学习装置使所述第一至所述第k卷积层生成所述第一至所述第k编码特征映射;(b)所述学习装置使所述第(k-1)至所述第一反卷积层依次生成所述第(k-1)至所述第一解码特征映射,所述学习装置使所述第h至所述第一掩膜层(i)从由每个所述h个反卷积层输出的每个h个基本解码特征映射中提取边缘部分来生成第h至第一边缘特征映射,每个所述h个反卷积层分别与所述第h至所述第一掩膜层对应;(ii)参考所述h个基本解码特征映射和所述第h至所述第一边缘特征映射,生成h个边缘增强解码特征映射,用作所述第(k-1)至所述第一解码特征映射中的至少一部分;以及(c)所述学习装置使所述第一至所述第h边缘损失层参考所述边缘部分和与其对应的地面实况,生成第一至第h边缘损失,并通过使用所述第一至所述第h边缘损失的反向传播来调整所述第一至所述第(k-1)反卷积层和所述第k至所述第一卷积层中的至少一部分的一个以上的参数。
背景技术
深度学习是一种用于对事物或数据进行聚类或分类的技术。例如,计算机不能只通过照片来区分狗和猫。但人们可以很容易地区分它们。为此,设计了一种称为“机器学习(Machine Learning)”的方法。这是一种使计算机在输入的大量数据中分类相似数据的技术。当输入与所存储的狗的照片类似的照片时,计算机将其分类为狗的照片。
已经出现了许多关于如何对数据进行分类的机器学习算法。以“决策树”、“贝叶斯网络”、“支持向量机(SVM)”和“人工神经网络”等为代表。深度学习是人工神经网络的后代。
深度卷积神经网络(Deep Convolution Neural Networks;Deep CNN)是深度学习领域惊人发展的核心。CNN已经在90年代用于解决文字识别问题,但如现在这样被广泛使用源自最近的研究结果。这些深度CNN在2012年的ImageNet图像分类竞赛中击败了其他竞争对手并赢得了冠军。然后,卷积神经网络已成为机器学习领域中非常有用的工具。
图像分割(Image Segmentation)是一种使用至少一个输入图像生成至少一个标签图像(label image)的方法。近年来,随着深度学习(Deep learning)技术广受关注,深度学习越来越多地用于分割。最初仅通过使用编码器(Encoder)方法进行了所述分割,例如,通过一次以上的卷积运算生成所述标签图像的方法等。随后,通过由所述编码器提取所述图像特征并由解码器(Decoder)将该特征复原为所述标签图像的编码器-解码器(Encoder-Decoder)结构的方法来执行所述分割。
图1简要示出使用CNN的以往的分割的过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯特拉德视觉公司,未经斯特拉德视觉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911055501.9/2.html,转载请声明来源钻瓜专利网。