[发明专利]用于图像处理的神经网络对象识别的方法和系统在审

专利信息
申请号: 201880094093.5 申请日: 2018-10-26
公开(公告)号: CN112889068A 公开(公告)日: 2021-06-01
发明(设计)人: 郭萍;张丽丹;任海兵;张益民 申请(专利权)人: 英特尔公司
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 董越
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 图像 处理 神经网络 对象 识别 方法 系统
【权利要求书】:

1.一种由计算机实现的用于图像处理的对象识别方法,包括:

获得捕获的视频序列的帧的图像数据,并包括要被识别并添加到对象的神经网络训练数据库的至少一个对象的内容,以便通过包括特定用户的至少一个所需对象来定制所述神经网络训练数据库;

将这些帧输入到与通用数据库相关联的一般知识神经网络中,以输出与对象的实例相关联的多个候选掩膜;

通过将添加掩膜添加到所述训练数据库来定制所述训练数据库,所述添加掩膜是所述多个候选掩膜中被选择的一个掩膜;

将所述帧输入到实例分割神经网络中以输出分割掩膜;

修改所述实例分割神经网络以形成经修改的实例分割神经网络,其中所述修改至少部分地基于所述训练数据库中的至少一个添加掩膜;以及

通过使用所述经修改的实例分割神经网络来在推理运行时期间执行对象识别。

2.如权利要求1所述的方法,包括:通过将各个候选掩膜与从所述实例分割神经网络输出的分割掩膜进行比较,来确定各个候选掩膜的质量分数。

3.如权利要求2所述的方法,包括:选择具有最高质量分数并且满足至少一个阈值标准的候选掩膜来作为添加掩膜。

4.如权利要求2所述的方法,包括:至少基于颜色直方图比较来计算所述质量分数。

5.如权利要求2所述的方法,包括:至少基于与Jaccard相关的值来计算所述质量分数。

6.如权利要求1所述的方法,包括:根据添加掩膜的帧与正被分析的当前目标帧沿着所述视频序列有多接近,使所述实例分割神经网络局部地适配于来自所述训练数据库的添加掩膜。

7.如权利要求6所述的方法,其中,所述添加掩膜的所述帧越接近所述当前目标帧,所述实例分割神经网络就越有可能要被适配于所述添加掩膜。

8.如权利要求6所述的方法,其中,在距离所述当前目标帧最近的五帧处的添加掩膜具有大约70%的机会被用于适配所述实例分割神经网络,而比所述最近的五帧更远的帧具有更小的机会被用于适配所述实例分割神经网络。

9.如权利要求8所述的方法,其中,所述比所述最近的五帧更远的帧具有大约30%的机会被用于适配所述实例分割神经网络。

10.如权利要求6所述的方法,包括:除了局部适配之外,还使所述实例分割神经网络全局地适配于所述视频序列的基本上每个帧的添加掩膜,使得所述局部适配的添加掩膜被使用多于一次。

11.如权利要求1所述的方法,包括:使所述实例分割神经网络全局地适配于所述视频序列的基本上每个帧的添加掩膜。

12.如权利要求1所述的方法,包括:通过以下操作来利用有监督训练适配所述实例分割神经网络:将来自所述训练数据库的添加掩膜用作到所述实例分割神经网络的输出,以及将具有相应单独添加掩膜的图像数据的帧用作到所述实例分割神经网络的输入。

13.如权利要求1所述的方法,其中,当被输入到所述一般知识神经网络时,所述视频序列中仅一个帧在该帧上具有一个或多个对象的注释。

14.如权利要求1所述的方法,其中,当被输入到所述实例分割神经网络时,所述视频序列中仅一个帧在该帧上具有一个或多个对象的注释。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201880094093.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top