[发明专利]图像数据分类与建立分类模型方法、装置及系统有效
申请号: | 201610431109.X | 申请日: | 2016-06-16 |
公开(公告)号: | CN107516102B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 朱望江;胡杰;孙刚;曹旭东 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N7/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 马永芬 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 数据 分类 建立 模型 方法 装置 系统 | ||
1.一种建立神经网络分类模型的方法,其特征在于,包括:
获取包含目标对象的至少一帧图像数据;
分别从各帧图像数据中确定若干个关键区域,所述若干个关键区域中的每个关键区域为至少包含部分所述目标对象的概率满足预定要求的区域;
从所述若干个关键区域中选取至少一个关键区域作为神经网络的数据输入,对所述神经网络进行训练;
根据所述神经网络输出的训练结果调整所述神经网络的结构参数,以建立神经网络分类模型;
其中,所述分别从各帧图像数据中确定若干个关键区域包括:
生成多个包围盒,所述多个包围盒分别覆盖至少局部不同的多个像素区域;
分别根据所述多个包围盒覆盖的所述多个像素区域确定各包围盒的质量得分,每个包围盒的质量得分用于表征所述包围盒包含所述目标物体的概率大小;
根据各所述质量得分从所述多个包围盒中选出若干个包围盒,将所述若干个包围盒覆盖的像素区域作为所述若干个关键区域;
所述图像数据包括在时域上连续的若干帧图像;
所述根据各所述质量得分从所述多个包围盒中选出若干个包围盒,包括:
确定各包围盒在所述若干帧图像上的平均质量得分,其中,各包围盒在所述若干帧图像上的位置相同;
根据所述平均质量得分从所述多个包围盒中选出若干个包围盒。
2.如权利要求1所述的方法,其特征在于,所述根据各所述质量得分从所述多个包围盒中选出若干个包围盒,包括:
按各所述质量得分从高到低的顺序从所述多个包围盒中选出若干个包围盒。
3.如权利要求1所述的建立神经网络分类模型的方法,其特征在于,所述根据所述平均质量得分从所述多个包围盒中选出若干个包围盒包括:根据所述平均质量得分分别对各包围盒在所述若干帧图像上进行非极大抑制运算,以确定所述若干个关键区域。
4.如权利要求1所述的建立神经网络分类模型的方法,其特征在于,所述对所述神经网络进行训练包括:
提取与所述至少一关键区域分别对应的至少一数据特征;
分别将所述至少一数据特征转换成与对应的各关键区域分别对应的各分类器的预测输出,所述各分类器的预测输出包含分别与N种图像数据标签对应的N个元素,其中N为大于1的整数;每个元素用于表征对应关键区域属于对应种类图像数据标签的概率;
根据所述各分类器的预测输出分别确定所述各分类器的损失函数,以得到所述训练结果。
5.如权利要求4所述的建立神经网络分类模型的方法,其特征在于,采用如下公式确定所述各分类器的损失函数:
lossu=-([label=u]log(pu)+[label≠u]log(1-pu)),其中,所述u为整数,且1≤u≤N,lossu为第u个逻辑斯蒂回归器的损失函数,label为所述关键区域的标签,[.]为示性函数,pu为第u个逻辑斯蒂回归器的概率预测。
6.如权利要求4或5所述的建立神经网络分类模型的方法,其特征在于,所述输出所述神经网络的训练结果包括:
分别选取所述各分类器的预测输出中每个种类图像数据标签对应的各元素中最大的值作为训练结果输出。
7.如权利要求4或5所述的建立神经网络分类模型的方法,其特征在于,在所述输出所述神经网络的训练结果之前,还包括:
确定所述N种图像数据标签中的学习的图像数据标签;
所述输出所述神经网络的训练结果包括:
对于所述各分类器的预测输出中与所述学习的图像数据标签对应的各元素,以所述各元素分别与所述各元素之和的比值分别作为所述各元素被随机选择的概率,随机选择所述各元素作为训练结果输出;
对于所述各分类器的预测输出中的其他元素,将每个种类图像数据标签对应的各元素中最大的值作为训练结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610431109.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种边界数据划分方法与设备
- 下一篇:一种影像分类方法和系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置