[发明专利]一种基于人工智能技术的消防通道占用识别方法和装置有效
申请号: | 202111455510.4 | 申请日: | 2021-12-01 |
公开(公告)号: | CN113869290B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 申永利;周岐文;李新刚 | 申请(专利权)人: | 中化学交通建设集团有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/774;G06V10/764;G06K9/62 |
代理公司: | 北京法胜知识产权代理有限公司 11922 | 代理人: | 戎郑华 |
地址: | 250102 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 技术 消防 通道 占用 识别 方法 装置 | ||
1.一种基于人工智能技术的消防通道占用识别方法,其特征在于,包括:
实时采集视频数据;其中,所述视频数据中包括消防通道区域的图像;
从所述视频数据中截取至少一张待识别图像;
将所述待识别图像输入至训练好的Vision transformer网络模型,生成带有表示消防通道占用的正标签或未占用的负标签的预测图像,所述预测图像为所述带有表示消防通道占用的正标签或未占用的负标签的图像块;
将所述预测图像输入至训练好的分类识别模型,以生成所述待识别图像的消防通道占用的检测结果;
所述将所述预测图像输入至训练好的分类识别模型,以生成所述待识别图像的消防通道占用的检测结果,包括:
将所述预测图像进行拼接,获取完整的消防通道区域的目标图像;
将所述目标图像输入至训练好的分类识别模型,生成所述待识别图像的消防通道占用的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别图像输入至训练好的Vision transformer网络模型,生成带有表示消防通道占用的正标签或未占用的负标签的预测图像,包括:
对所述待识别图像进行处理,生成图像块序列;
将所述图像块序列加上位置信息输入至训练好的Vision transformer模型的编码器encoder中,得到编码后的图像块特征;
将编码后的图像块特征经过一个零初始化的D*K前馈层,输出每个图像块的类别为消防通道的概率分布;其中,K为2,D是encoder每层输出的特征维度大小;
根据每个图像块的类别为消防通道的概率分布,生成带有表示消防通道占用的正标签或未占用的负标签的预测图像。
3.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
获取训练数据集;
将所述训练数据集输入至Vision transformer网络模型,对所述Vision transformer网络模型进行训练,生成训练好的Vision transformer网络模型。
4.根据权利要求3所述的方法,其特征在于,所述获取训练数据集,包括:
从监控设备所拍摄的视频中提取多张样本图像;
将消防通道占用的样本图像标记为正训练样本,以及将消防通道未占用的样本图像标记为负训练样本,生成训练数据集。
5.根据权利要求4所述的方法,其特征在于,所述方法,还包括:
通过图像采集装置获取消防通道占用的补充图像并标记为正训练样本,或者,将消防通道占用的样本图像和/或补充图像通过数据增强,获取消防通道占用的增强样本图像并标记为正训练样本。
6.一种基于人工智能技术的消防通道占用识别装置,其特征在于,包括:
视频采集单元,用于实时采集视频数据;其中,所述视频数据中包括消防通道区域的图像;
图像获取单元,用于从所述视频数据中截取至少一张待识别图像;
标签预测单元,用于将所述待识别图像输入至训练好的Vision transformer网络模型,生成带有表示消防通道占用的正标签或未占用的负标签的预测图像,所述预测图像为所述带有表示消防通道占用的正标签或未占用的负标签的图像块;
分类识别单元,用于将所述预测图像输入至训练好的分类识别模型,以生成所述待识别图像的消防通道占用的检测结果;
所述分类识别单元,具体用于:
将所述预测图像进行拼接,获取完整的消防通道区域的目标图像;将所述目标图像输入至训练好的分类识别模型,生成所述待识别图像的消防通道占用的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中化学交通建设集团有限公司,未经中化学交通建设集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111455510.4/1.html,转载请声明来源钻瓜专利网。