[发明专利]一种实景地标识别方法在审
申请号: | 202211471988.0 | 申请日: | 2022-11-23 |
公开(公告)号: | CN115880711A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 王峥;陈眺;曲宝珠;董文君;王康 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | G06V30/422 | 分类号: | G06V30/422;G06V10/766;G06V10/764;G06V10/24;G06V10/40;G06V10/82 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 韩天宇 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实景 地标 识别 方法 | ||
1.一种实景地标识别方法,其特征在于,所述方法包括:
通过地标定位网络对地标区域进行定位,并提取出地标区域的区域特征;
通过整图特征网络提取地标的整图特征;
对所述区域特征和整图特征进行双特征判断,生成地标的识别结果。
2.根据权利要求1所述的实景地标识别方法,其特征在于,所述通过定位网络对地标区域进行定位具体包括:
采用特征金字塔结构进行多尺度区域检索,输出为3个尺度的特征图,分别为19*19,38*38和76*76,其中,每个尺度中的一点包含:左上角和右下角坐标、地标的置信度以及各个地标的分类置信度,全部的数据维度使用n表示,每一种尺度的输出特征均通过底层特征和高层特征进行拼接,使得每个特征图均包含低层基础信息和高层语义信息。
3.根据权利要求2所述的实景地标识别方法,其特征在于,3个尺度分别对应9个区域框,每个尺度对应3个区域框,该区域框通过kmeans算法计算而来。
4.根据权利要求1所述的实景地标识别方法,其特征在于,在通过地标定位网络对地标区域进行定位的训练中使用的回归方法,包含若干种损失函数,分别是坐标框中心点回归、坐标高宽回归、坐标框重合回归。
5.根据权利要求1所述的实景地标识别方法,其特征在于,所述提取出地标区域的区域特征具体包括:
计算真实框和对应的多个预测框宽高比例和,然后计算出这些比例和他们倒数之间的最大值和,获取真实框和预测框在宽度和高度方向的最大差异;
计算宽度方向和高度方向最大差异之间的最大值。
6.根据权利要求5所述的实景地标识别方法,其特征在于,所述方法还包括:对地标特征进行学习,采用了Losscls进行分类优化,采用Lossconf进行了目标过滤的优化,Losscls和Lossconf之和作为特征损失进行模型优化,其中,
上式中,n表示地标类别数量,作为真实类别置信度,表示为1或者0;表示预测的类别置信度;y表示二分类中的真实类别置信度,表示预测的类别置信度。
7.根据权利要求1所述的实景地标识别方法,其特征在于,整图特征的提取网络和区域定位网络使用相同的主干网络,在训练时,整图特征网络和区域定位网络分别使用不同的训练数据,在训练的前期阶段,采用二阶段训练的方式进行网络更新,整图特征优化时采用冻结主干网络的方式进行优化;在训练的后期阶段,训练图片的批处理包含整图训练数据定位训练数据,并使用相同的归一化预处理方式,同时根据对应的训练数据进行损失计算并更新对应网络,而主干网络则会同时进行更新。
8.根据权利要求7所述的实景地标识别方法,其特征在于,所述整图特征优化损失函数为:
/
其中,表示预测的类别置信度。/
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211471988.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种旋转机械扭转振动测试系统及试验方法
- 下一篇:数据处理方法、系统及设备