[发明专利]一种用于不规则图形的目标检测技术在审
申请号: | 202110316581.X | 申请日: | 2021-03-24 |
公开(公告)号: | CN113420774A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 廖家舟;刘志鹏;郭敬娜 | 申请(专利权)人: | 成都理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610059 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 不规则 图形 目标 检测 技术 | ||
1.一种用于不规则图形的目标检测技术,其特征在于,实验平台包括CPU、GPU、编程语言、CUDA。
所述的CPU内存为16G,是电子计算机的主要设备之一,电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。
所述的GPU为NVIDIA GeForce GTX 1080Ti,采用了16nm制程GP102核心,拥有3584个CUDA核心,224个纹理单元,88个ROP单元,搭配352-bit 11GB GDDR5X超大容量显存。该卡性能比GeForce GTX 1080提升35%,比GeForce GTX 1070提升78%,甚至超越了当前性能最强的卡皇NVIDIA TITAN X Pascal。
所述的编程语言为Python,该语言为我们提供了非常完善的基础代码库,覆盖了网络、文件GUI、数据库、文本等大量内容,被形象地称作内置电池(batteries included)。Python的开发使得许多功能不再从零开始写起,直接使用现成即可。Python除了内置的库以外,还有许多第三方库供编程者直接使用。Python的语言特点就是优雅、明确、简单。因而被广泛应用编码中。
所述的CUDA全称为Compute Unified Device Architecture,是显卡厂商NVIDIA推出的运算平台。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。本专利使用的版本为CUDA10.0 with cudnn7.1。
2.根据权利要求1所述的系统,其特征在于对不规则图形进行快速准确的目标检测。为此所选用的算法在mobilenet_v2_224的基础上添加了全连接层,网络中的算法模型使用全卷积神经网络,并在自制数据集上进行训练和评估。本系统的实验流程为:1.安装ubuntu16.04操作系统,配置Anaconda版本为Anaconda3,python版本为3.6.5,CUDA版本为10.0,cudnn版本为7.1。Tensorflow-gpu 1.14.0以及其他所需要的安装包。2.对数据集进行预处理操作,该操作在装有Anaconda环境的pycharm中运行。3.对预处理过后的数据集使用mobilenet_v2_224_fpn算法进行目标检测。4.通过评价指标在测试集上对该模型进行评价。该过程中激活函数使用RELU函数,如公式1所示。损失函数采用点回归Loss1和边缘回归Loss2相结合的方式,Loss1如公式2所示,其中(x1,y1),(x2,y2),(x3,y3),(x4,y4)为四边形四个点的真实坐标,(x1',y1'),(x2',y2'),(x3',y3'),(x4',y4')为预测坐标。Loss2如公式3所示,a,b,c,d为四边形四个角的角度。最终损失函数Loss如公式4所示。优化器选择Adam算法优化器进行优化。评价指标采用mAP(mean average precision),mean为类的别平均,average precision为一个类别的平均精确度,P(Precision)精确率的公式如公式5所示,R(Recall)召回率的公式如公式6,其中TP为True Positive,被判定为正样本,事实上也是正样本;TN为True Negative,被判定为负样本,事实上也是负样本;FP为FalsePositive,被判定为正样本,但事实上是负样本;FN为False Negative,被判定为负样本,但事实上是正样本。因而构成PR曲线。mAP的计算则为PR曲线的面积。
Loss=Loss1+Loss2 公式4
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110316581.X/1.html,转载请声明来源钻瓜专利网。