[发明专利]一种用于对目标对象的属性特征进行识别的方法及装置在审
申请号: | 201811003925.6 | 申请日: | 2018-08-30 |
公开(公告)号: | CN109359515A | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 邹博;李昕;冯莹莹;潘自兴;孙登蕊 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 郭一斐 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 目标对象 属性特征 训练数据 多个属性 计算机程序产品 视频流数据 图像数据集 动态调整 损失函数 图像选取 解码 负样本 正样本 标签 输出 检测 | ||
本发明公开了一种用于对目标对象的属性特征进行识别的方法、装置、系统以及计算机程序产品,其中方法包括:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练;在对所述深度卷积神经网络进行训练的过程中,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数;以及对待检测的视频流数据进行解码和图像选取,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。
技术领域
本申请涉及信息处理领域,并且具体的涉及一种用于对目标对象的属性特征进行识别的方法、装置、系统以及计算机程序产品。
背景技术
视频监控被广泛应用于各种领域,在智能交通、银行、平安城市、公共安全等行业中有着重要的作用,为人类生活的多个方面带来了方便和保障,但同时,海量的视频监控流使得有效信息的快速搜索变得十分困难,需耗费大量的人力物力。对目标对象的属性特征进行有效的识别,不仅能提高视频监控人员的工作效率,对视频的检索、目标对象行为解析等也具有重要意义。
目标对象的属性识别的难点主要在于,在目标对象的属性特征的正负样本的比值严重失调的情况下,损失函数使用固定的正负样本的比值,导致识别准确率低的问题。
发明内容
本申请提供的用于对目标对象的属性特征进行识别的方法,解决了识别过程中,在目标对象的属性特征的正负样本的比值严重失调的情况下,损失函数使用固定的正负样本的比值,导致识别准确率低的问题。
本申请提供一种用于对目标对象的属性特征进行识别的方法,其特征在于,包括:
将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;
使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;
获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。
优选的,其中所述目标对象为行人,并且所述所获取的包含不同属性特征标签的图像数据集包括:
行人的图像数据;以及
行人的不同属性特征标签。
优选的,所述行人的不同属性特征标签包括:
性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话。
优选的,所述使用所述训练数据对所述深度卷积神经网络进行训练,包括:
根据预先设置的尺寸并使用归一化方法对所述训练数据进行处理,以将图像数据集中的所有图像数据转换为相同尺寸的图像数据;使用所述相同尺寸的图像数据对深度卷积神经网络进行训练。
优选的,当所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态时,能够缩小输出值与真实值之间的差距。
优选的,其中根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,包括:
动态损失函数为:
当正样本的数量与负样本的数量的比值小于1:3时:
当正样本数量与负样本的数量的比值大于3时:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811003925.6/2.html,转载请声明来源钻瓜专利网。