[发明专利]一种构建注意力识别模型的方法及装置在审
申请号: | 202110025525.0 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112613491A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 刘向阳;赵晨旭;唐大闰 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 裴素英 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 注意力 识别 模型 方法 装置 | ||
1.一种构建注意力识别模型的方法,其特征在于,包括:
对不同教室采集的头部图像集中的每一头部图像进行标注,所述标注包括:注意力集中或注意力未集中,每一教室对应一头部图像集;
对各头部图像集进行支撑集组织和查询集组织,得到支撑集-查询集对,所述支撑集至少包含两个头部图像集,所述查询集包含一个头部图像集;
依据支撑集对注意力识别初始模型进行训练,得到注意力识别中间模型;
依据查询集对注意力识别中间模型进行训练,获取总查询识别损失;
将支撑集-查询集对输入去掉分类层的注意力识别中间模型进行训练,获取总距离损失;
依据总查询识别损失以及总距离损失计算总损失,若总损失小于预先设置的总损失阈值,将所述注意力识别中间模型作为注意力识别模型,否则,调整训练的注意力识别初始模型的模型参数,直至总损失小于所述总损失阈值。
2.根据权利要求1所述的方法,其特征在于,所述对不同教室采集的头部图像集中的每一头部图像进行标注,包括:
针对从不同教室采集的每一图片集,检测出包含头部的图片;
对包含头部的图片进行尺寸一致处理,得到该图片集对应的头部图像集,为得到的头部图像集中的每一头部图像设置注意力集中标签或注意力未集中标签。
3.根据权利要求1所述的方法,其特征在于,所述对各头部图像集进行支撑集组织包括:
将第一头部图像集和第二头部图像集中具有相同标签的头部图像组成头部图像对,各头部图像对组成头部图像对集,依据头部图像对集得到支撑集。
4.根据权利要求3所述的方法,其特征在于,所述依据支撑集对注意力识别初始模型进行训练,包括:
对于每一支撑集,针对该支撑集中的每一头部图像对,将该头部图像对输入注意力识别初始模型进行训练,依据注意力识别初始模型的输出计算该支撑集对应的识别损失;
基于各支撑集对应的识别损失,计算总支撑识别损失;
若总支撑识别损失大于预先设置的支撑识别损失阈值,更新注意力识别初始模型的模型参数,直至总支撑识别损失不大于所述支撑识别损失阈值。
5.根据权利要求4所述的方法,其特征在于,所述针对该支撑集中的每一头部图像对,将该头部图像对输入注意力识别初始模型进行训练,包括:
选取支撑集中预设第一数量的头部图像对,构建头部图像对训练集;
在每次进行迭代后,从头部图像对训练集中删除预设第二数量的头部图像对,从支撑集中,提取预设第二数量的头部图像对,添加至头部图像对训练集中。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述依据查询集对注意力识别中间模型进行训练,获取总查询识别损失,包括:
针每一查询集,将该查询集中的头部图像输入所述注意力识别中间模型,得到该查询集对应的查询识别损失,基于各查询识别损失,计算总查询识别损失。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述将支撑集-查询集对输入去掉分类层的注意力识别中间模型进行训练,获取总距离损失,包括:
将支撑集输入去掉分类层的注意力中间识别模型,得到对应的支撑特征,将查询集输入去掉分类层的注意力中间识别模型,得到对应的查询特征;
针对每一查询特征,计算该查询特征的查询特征中心,以及,针对每一支撑特征,计算该支撑特征的支撑特征中心;
针对每一支撑集-查询集对中包含的支撑集的支撑特征中心和查询集的查询特征中心,计算该支撑集-查询集对的距离损失;
对各支撑集-查询集对的距离损失进行加权求和,得到总距离损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110025525.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:绝缘自锁挂钩
- 下一篇:一种污水排水管非开挖修复装置