[发明专利]行为识别及模型训练的方法、设备、存储介质和程序产品在审
申请号: | 202110721126.8 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113420681A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 胡韬;苏翔博 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为 识别 模型 训练 方法 设备 存储 介质 程序 产品 | ||
1.一种行为识别的方法,包括:
将待处理的图像输入行为识别模型的特征提取网络,提取所述图像的图像特征;
将所述图像特征和所述图像特征对应的位置信息编码,输入所述行为识别模型的基于多分支子注意力机制的分类网络,通过所述分类网络,识别所述图像所包含人体的行为信息。
2.根据权利要求1所述的方法,其中,所述将所述图像特征和所述图像特征对应的位置信息编码,输入所述行为识别模型的基于多分支子注意力机制的分类网络,通过所述分类网络,识别所述图像所包含的人体的行为信息,包括:
将所述图像特征和所述位置信息编码,输入所述分类网络,通过所述分类网络,输出指定数量的行为信息,以及每一所述行为信息对应的置信度;
将置信度大于置信度阈值的行为信息,作为所述图像所包含的人体的行为信息。
3.根据权利要求1或2所述的方法,其中,所述将待处理的图像输入行为识别模型的特征提取网络,提取图像的图像特征之后,还包括:
对所述图像特征进行降维处理,得到预设维度的图像特征。
4.根据权利要求3所述的方法,其中,所述将所述图像特征和所述图像特征对应的位置信息编码,输入所述行为识别模型的基于多分支子注意力机制的分类网络,通过所述分类网络,识别所述图像所包含人体的行为信息之前,还包括:
根据所述预设维度,对所述图像特征中的像素进行位置编码,得到所述图像特征对应的位置信息编码。
5.根据权利要求1-4中任一项所述的方法,其中,
所述行为信息用于描述所述人体与物体发生的交互行为,
所述行为信息包括所述人体的位置信息、所述物体的位置信息和类别、和所述交互行为的行为类别。
6.根据权利要求5所述的方法,其中,所述将待处理的图像输入行为识别模型的特征提取网络,提取所述图像的图像特征之前,还包括:
接收所述待处理的图像;
或者,
采集指定场所内的包含人物的图像,作为所述待处理的图像。
7.根据权利要求5所述的方法,其中,所述将所述图像特征和所述图像特征对应的位置信息编码,输入所述行为识别模型的基于多分支子注意力机制的分类网络,通过所述分类网络,识别所述图像所包含人体的行为信息之后,还包括:
根据所述图像所包含的人体的行为信息,若确定任一所述行为信息中的行为类别属于预设行为集合,则对行为类别属于预设行为集合的所述行为信息进行相应的处理。
8.根据权利要求7所述的方法,其中,所述对行为类别属于预设行为集合的所述行为信息进行相应的处理,包括:
根据行为类别属于预设行为集合的所述行为信息,生成行为报告,并按照预设规则存储或发送所述行为报告。
9.一种行为识别模型训练的方法,其中,所述行为识别模型包括特征提取网络和基于多分支自注意力机制的分类网络,所述方法包括:
将样本图像输入所述特征提取网络,提取所述样本图像的图像特征;
将所述图像特征和所述图像特征对应的位置信息编码,输入所述基于多分支子注意力机制的分类网络,通过所述分类网络,识别所述样本图像所包含的人体的行为信息,得到所述行为信息的预测数据;
根据所述行为信息的真实数据和所述预测数据,计算损失值,并根据所述损失值更新所述行为识别模型的参数。
10.根据权利要求9所述的方法,其中,所述将样本图像输入所述特征提取网络,提取所述样本图像的图像特征之后,还包括:
对所述图像特征进行降维处理,得到预设维度的图像特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721126.8/1.html,转载请声明来源钻瓜专利网。