[发明专利]一种计算机视觉基础网络训练识别构建方法及装置在审

专利信息
申请号: 201911064381.9 申请日: 2019-11-04
公开(公告)号: CN110909625A 公开(公告)日: 2020-03-24
发明(设计)人: 向仲宇 申请(专利权)人: 向仲宇
主分类号: G06K9/00 分类号: G06K9/00;G06N3/04;G06N3/08
代理公司: 成都东唐智宏专利代理事务所(普通合伙) 51261 代理人: 罗言刚
地址: 610000 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 计算机 视觉 基础 网络 训练 识别 构建 方法 装置
【说明书】:

一种计算机视觉基础网络训练识别构建方法,包括如下步骤:收集样本:采集摄像头采集的视频信息,并对摄像头的拍摄角度和移动轨迹信息进行实时纪录并与视频信息中的各帧画面对应;训练:截取一定时间长度内的视频帧及对应的角度和轨迹信息作为样本信息,构建深度学习网络并输入样本信息进行训练;进行识别。本发明还公开了一种计算机视觉基础网络训练识别样本采集装置,包括至少一个摄像头和可纪录摄像头拍摄角度和轨迹的设备。本发明不再需要手动对数据标注,可以快速低成本生成大规模数据集,模型可以根据采集图像的轨迹和角度变化自动预测后续时间的图像,并合成三维空间,可以广泛用于自动驾驶,空间生成等需要生成、感知三维空间的应用情形上。

技术领域

本发明属于图像识别领域,涉及人工智能图像识别技术,具体涉及一种计算机视觉基础网络训练识别构建方法及装置。

背景技术

近年来随前深度学习技术兴起,计算机视觉利用深度学习技术也取得了长足的进步。在图像分类方面,计算机视觉的深度学习神经网络的学习能力已经在部分数据集中超过了人类;深度学习在计算机视觉的语义分割、关键节点检测、目标检测定位、人脸识别、自动驾驶等多个计算机视觉任务中都取得了非凡的成绩。同时我们也可以看出,取得的这些成绩主要来源于三个方面;第一、来源于算法和网络的改进,我们可以设计更精巧、更有效、更大、更深的网络,如:RESNET,FASTER-RCNN等,包含数千万的参数;第二、源自计算能力的大幅提升,现在的GPU,TPU服务器大大的提升了运算速度,使训练更大的网络成来可能;第三、来源于更多的训练数据,如IMAGENET,COCO,MINIST等数据集,其中IMAGENET包括上千万标注数据,但是标注数据需要花费非常多的人力物力。

现有技术中,需要花费巨大精力进行数据集的标注,可能在某一数据集中训练取得很好成绩的模型在另一数据集上并不能取得好的成绩,即模型只能在一定范围内适用即限入了局部最优。数据集最多也就可包括上千万张图像,然而人一天眼睛看到的图像以每秒30帧,16小时为例,就会有170万张,也就是最大的数据集相当于人看6天的图像量,可见采用标注方式的图像数据集的数量有限。

发明内容

为克服现有技术存在的技术缺陷,本发明公开了一种计算机视觉基础网络训练识别构建方法及装置。

本发明所述计算机视觉基础网络训练识别构建方法,其特征在于,包括如下步骤:

收集样本:采集摄像头采集的视频信息,并对摄像头的拍摄角度和移动轨迹信息进行实时纪录并与视频信息中的各帧画面对应;

训练:截取某一时间点前或后一定时间长度内的视频帧及对应的角度和轨迹信息作为网络输入,选取这一时间点后或前一定时间内的某一视频帧作为网络输出参照图像,构建深度学习网络并输入样本信息进行训练;

识别:根据训练得到的深度学习网络,输入视频信息及对应的拍摄角度和移动轨迹信息,进行识别构建。

优选的,所述深度学习网络为卷积层、循环层、激活函数、归一化层、全联接层中的一种或多种结合组成。

优选的,所述训练的具体方式为:设置损失函数为根据样本信息训练得到的输出信息与相同时间的实际图像的差值;所述输出信息的时间点不在样本信息的时间范围内;

输入样本训练目标为损失函数最小。

优选的,还包括训练中的优化步骤,所述优化函数包括但不限于SGD,Adagrad,Adadelta,Adam。

优选的,所述训练和识别步骤中,输入信息时一并输入待输出图像的位移信息。

优选的,所述损失函数为以下任意一种:

网络输出图像与对应真实图像总体像素差值绝对值之和;

网络输出图像与对应真实图像特定区域的像素差值绝对值之和,所述特定区域为图像中容易识别的部分,如颜色与轮廓突出部分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于向仲宇,未经向仲宇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911064381.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top