[发明专利]一种计算机视觉基础网络训练识别构建方法及装置在审
申请号: | 201911064381.9 | 申请日: | 2019-11-04 |
公开(公告)号: | CN110909625A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 向仲宇 | 申请(专利权)人: | 向仲宇 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 成都东唐智宏专利代理事务所(普通合伙) 51261 | 代理人: | 罗言刚 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算机 视觉 基础 网络 训练 识别 构建 方法 装置 | ||
1.一种计算机视觉基础网络训练识别构建方法,其特征在于,包括如下步骤:
收集样本:采集摄像头采集的视频信息,并对摄像头的拍摄角度和移动轨迹信息进行实时纪录并与视频信息中的各帧画面对应;
训练:截取某一时间点前或后一定时间长度内的视频帧及对应的角度和轨迹信息作为网络输入,选取这一时间点后或前一定时间内的某一视频帧作为网络输出参照图像,构建深度学习网络并输入样本信息进行训练;
识别:根据训练得到的深度学习网络,输入视频信息及对应的拍摄角度和移动轨迹信息,进行识别构建。
2.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,所述深度学习网络为卷积层、循环层、激活函数、归一化层、全联接层中的一种或多种结合组成。
3.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,所述训练的具体方式为:设置损失函数为根据样本信息训练得到的输出信息与相同时间的实际图像的差值;所述输出信息的时间点不在样本信息的时间范围内;
输入样本训练目标为损失函数最小。
4.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,还包括训练中的优化步骤,所述优化函数包括但不限于SGD,Adagrad,Adadelta,Adam。
5.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,所述训练和识别步骤中,输入信息时一并输入待输出图像的位移信息。
6.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,所述损失函数为以下任意一种:
网络输出图像与对应真实图像总体像素差值绝对值之和;
网络输出图像与对应真实图像特定区域的像素差值绝对值之和,所述特定区域为图像中容易识别的部分,如颜色与轮廓突出部分;
将图像分块,计算每个方块内的像素平均值,然后求网络输出图像与对应真实图像的每个对应块的平均值差的绝对值和。
7.如权利要求1所述的计算机视觉基础网络训练识别构建方法,其特征在于,所述识别步骤中,根据输入的视频信息,采用如下方式进行输出图形的构建:
记录输入视频信息中各个位置点的坐标及角度变化;
通过连续视频帧中关键位置点的坐标及角度变化规律,得出输出图形的对应位置点的坐标。
8.一种计算机视觉基础网络训练识别装置,其特征在于,包括至少一个摄像头和可纪录摄像头拍摄角度和轨迹的设备。
9.如权利要求8所述的计算机视觉基础网络训练识别装置,其特征在于,所述设备为陀螺仪、速度仪等能读取物体位移、角度变化的设备。
10.如权利要求8所述的计算机视觉基础网络训练识别装置,其特征在于,所述摄像头为多个,所述设备数量少于摄像头数量,还包括计算器,所述计算器可根据设备直接采集的某些摄像头拍摄角度和轨迹计算出未直接采集的摄像头拍摄角度和轨迹信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于向仲宇,未经向仲宇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911064381.9/1.html,转载请声明来源钻瓜专利网。