[发明专利]一种误报检测方法、装置及电子设备在审

申请号：	202210775095.9	申请日：	2022-07-01
公开（公告）号：	CN115187926A	公开（公告）日：	2022-10-14
发明（设计）人：	邹紫盛	申请（专利权）人：	杭州海康威视数字技术股份有限公司
主分类号：	G06V20/52	分类号：	G06V20/52;G06V40/70;G06V10/774
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	杨春香
地址：	310051 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种检测方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种误报检测方法，其特征在于，所述方法包括：

获取原始误报图像、用于描述所述原始误报图像中的误报对象的原始描述文本，基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本；

将所述多个扩展描述文本输入至已训练的多模态模型，得到与所述多个扩展描述文本对应的多个扩展误报图像，每个扩展误报图像均包括所述误报对象；

基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型；

其中，所述目标误报检测模型用于对待检测图像进行误报检测。

2.根据权利要求1所述的方法，其特征在于，所述原始描述文本包括所述误报对象的种类，所述扩展描述文本也包括所述误报对象的种类；所述基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本，包括：

在所述原始描述文本的所述误报对象的种类前面增加新描述语，将修改后的原始描述文本作为扩展描述文本；和/或，

将所述原始描述文本的所述误报对象的种类前面的描述语替换为新描述语，将修改后的原始描述文本作为扩展描述文本；

其中，所述新描述语是从已生成的描述语集合中选择的。

3.根据权利要求2所述的方法，其特征在于，所述原始误报图像是针对目标场景的图像，所述原始描述文本还包括针对所述目标场景的场景描述语，所述多个扩展描述文本还包括针对所述目标场景的场景描述语。

4.根据权利要求2所述的方法，其特征在于，所述新描述语用于表示以下至少一种：所述误报对象的颜色、姿态、材质、观察视角。

5.根据权利要求2所述的方法，其特征在于，所述多模态模型的训练过程包括：

获取训练图像、用于描述所述训练图像中的标定对象的训练描述文本，所述训练描述文本包括所述标定对象的种类以及所述标定对象的样本描述语；

基于所述训练图像和所述训练描述文本训练得到所述多模态模型，所述多模态模型用于拟合训练图像和训练描述文本之间的关系。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

基于所述训练描述文本中的样本描述语生成所述描述语集合。

7.根据权利要求1所述的方法，其特征在于，所述基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型之后，所述方法还包括：

将待检测图像输入给所述目标误报检测模型，得到所述待检测图像的误报识别结果；其中，所述误报识别结果表示由所述目标误报检测模型确定的所述待检测图像是误报图像还是非误报图像；

若所述误报识别结果表示所述待检测图像是非误报图像，则基于所述待检测图像更新原始误报图像，并依据更新后的原始误报图像重新训练误报检测模型。

8.一种误报检测装置，其特征在于，所述装置包括：

原始图像获取单元，用于获取原始误报图像和用于描述所述原始误报图像中的误报对象的原始描述文本，基于所述原始描述文本确定与所述误报对象对应的多个扩展描述文本；

扩展图像生成单元，用于将所述多个扩展描述文本输入至已训练的多模态模型，得到与所述多个扩展描述文本对应的多个扩展误报图像，每个扩展误报图像均包括所述误报对象；

检测模型训练单元，用于基于所述原始误报图像和所述多个扩展误报图像对原始误报检测模型进行训练，得到已训练的目标误报检测模型；其中，所述目标误报检测模型用于对待检测图像进行误报检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司，未经杭州海康威视数字技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210775095.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载