[发明专利]训练招牌分类模型和招牌分类的方法有效
申请号: | 202110723347.9 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113344121B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 李辉;王洪志;王昆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V20/56;G06V30/18;G06V30/19;G06V10/80;G06V10/764;G06V10/82;G06F40/30;G06N3/0455;G06N3/084 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 招牌 分类 模型 方法 | ||
1.一种训练招牌分类模型的方法,包括:
获取样本集,其中,所述样本集中的样本包括:图像、语义信息、样本标签;
执行如下训练步骤:从所述样本集中选取样本;将选取的样本中的图像和语义信息输入招牌分类模型,得到基于图像特征的第一预测结果、基于语义特征的第二预测结果、基于图像特征和语义特征的融合特征的第三预测结果;基于所述第一预测结果、所述第二预测结果、所述第三预测结果和样本标签计算总损失值;若总损失值小于预定阈值,则确定出所述招牌分类模型训练完成。
2.根据权利要求1所述的方法,其中,所述方法还包括:
若总损失值大于等于预定阈值,则调整招牌分类模型的相关参数,基于调整后的招牌分类模型继续执行上述训练步骤。
3.根据权利要求1所述的方法,其中,所述将选取的样本中的图像和语义信息输入招牌分类模型,得到基于图像特征的第一预测结果、基于语义特征的第二预测结果、基于图像特征和语义特征的融合特征的第三预测结果,包括:
通过图像特征提取网络从选取的样本中的图像中提取出图像特征;将所述图像特征经过图像全连接层后,得到图像表示;
通过语义特征提取网络从选取的样本中的语义信息中提取出语义特征;将所述语义特征经过语义全连接层后,得到语义表示;
将所述图像特征和所述语义特征通过共享全连接层后进行融合得到共享表示;
将所述图像表示和所述共享表示级联后输入第一分类器,得到第一预测结果;
将所述语义表示和所述共享表示级联后输入第二分类器,得到第二预测结果;
将所述共享表示输入第三分类器,得到第三预测结果。
4.根据权利要求1所述的方法,其中,所述基于所述第一预测结果、所述第二预测结果、所述第三预测结果和样本标签计算总损失值,包括:
基于所述第一预测结果与样本标签之间的差异计算第一损失值;
基于所述第二预测结果与样本标签之间的差异计算第二损失值;
基于所述第三预测结果与样本标签之间的差异计算第三损失值;
计算所述第一损失值、所述第二损失值、所述第三损失值的加权和作为总损失值。
5.根据权利要求4所述的方法,其中,所述第一损失值的权重与第二损失值的权重相同,并且大于第三损失值的权重。
6.一种招牌分类的方法,包括:
将检测到的招牌图片进行文字识别,得到文字信息;
将所述招牌图片和所述文字信息输入根据权利要求1-5中任一项所述的方法训练的招牌分类模型,得到图像得分和语义得分;
基于所述图像得分和所述语义得分输出所述招牌图片有效的概率。
7.一种训练招牌分类模型的装置,包括:
获取单元,被配置成获取样本集,其中,所述样本集中的样本包括:图像、语义信息、样本标签;
训练单元,被配置成执行如下训练步骤:从所述样本集中选取样本;将选取的样本中的图像和语义信息输入招牌分类模型,得到基于图像特征的第一预测结果、基于语义特征的第二预测结果、基于图像特征和语义特征的融合特征的第三预测结果;基于所述第一预测结果、所述第二预测结果、所述第三预测结果和样本标签计算总损失值;若总损失值小于预定阈值,则确定出所述招牌分类模型训练完成。
8.根据权利要求7所述的装置,其中,所述训练单元进一步被配置成:
若总损失值大于等于预定阈值,则调整招牌分类模型的相关参数,基于调整后的招牌分类模型继续执行上述训练步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110723347.9/1.html,转载请声明来源钻瓜专利网。