[发明专利]一种基于注意力机制的改进HRnet在审
申请号: | 202011084171.9 | 申请日: | 2020-10-12 |
公开(公告)号: | CN112270213A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 王聪;乔元风;蒋伟;柯钦瑜;黄勇;李紫薇 | 申请(专利权)人: | 萱闱(北京)生物科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 郑州中原专利事务所有限公司 41109 | 代理人: | 李想 |
地址: | 100010 北京市东城区王府井*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 改进 hrnet | ||
一种基于注意力机制的改进HRnet模型,其特征在于:当输入
技术领域
本发明涉及一种改进型算法,具体涉及一种基于注意力机制的改进HRnet模型。
背景技术
心脏骤停严重威胁人们的生命健康,开展优质的心肺复苏(CPR,cardiopulmonary resuscitation)可显著提升患者存活率,同时也是挽救患者生命的重要手段。美国心脏协会(AHA, American Heart Association)和国际复苏联络委员会(ILCOR,International Liaision Committee on Resuscitation)将高质量的心肺复苏术作为复苏的核心[1]。目前常规的心肺复苏训练、考核方式为应用医学模拟人并由裁判打分评判。这样做存在几个弊端,比如考官评判主观性强,不够客观;在考核评判过程中考生具体的按压深度、频率等均依赖模拟人本身的质量条件,考官很难评判;训练过程中学员需要考官时时监督配合来纠正和提高自身的操作,大量消耗培训和考核的人力成本等等。
现有技术在获取了考生的按压图像之后,由于按压动作是一个动态过程,无法根据按压图像判断考生按压姿态是否合格,这就给自动评判带来了困难。
同时,在对图像特征进行提取时,需要根据实际情况分割不同的模型。对于每一个模型,由于图像数据量大,保证模型的精度才能更好地实现人体姿态识别,因此,如何提供模型精度是一个亟待解决的问题。
发明内容
本发明要解决的技术问题是:如何提供模型的精度,提供一种基于注意力机制的改进HRnet模型。
为解决上述技术问题,本发明采用以下技术方案:
一种基于注意力机制的改进HRnet模型,其特征在于:当输入
表示在通道维度上做注意力提取的操作,即建立通道注意力机制模型,表示的是在空间维度上做注意力提取的操作,即建立空间注意力机制模型。
所述的通道注意力机制模型为:原始特征图Xin经过卷积核大小分别为3X3,5X5的卷积操作,得到特征图U和特征图V,然后相加得到特征图F,特征图F融合多个感受野的信息,其形状为[C,H,W],其中,C代表通道,H代表高度,W代表宽度,然后沿着H和W维度求平均值和极大值,通过两个pooling函数以后总共得到两个一维矢量;然后对两个一维矢量进行元素相加,最终得到了关于通道的信息是一个1×1×C的一维向量,代表的是各个通道的信息的重要程度;对1×1×C一维向量进行一个线性变换,将原来的C维映射成Z维的信息,然后将映射成Z维的一维向量再分别使用了2个线性变换,从Z维变为原来的C维,从而完成了针对通道维度的信息提取,然后使用Softmax进行归一化,这时候每个通道对应一个分数,代表该通道的重要程度,这相当于一个mask;将这2个分别得到的mask分别乘以对应的特征图U,V,得到特征图U’,V’;然后对特征图U’和V’这2个模块相加,进行信息融合,得到最终模块Xout。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于萱闱(北京)生物科技有限公司,未经萱闱(北京)生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011084171.9/2.html,转载请声明来源钻瓜专利网。