[发明专利]基于全卷积神经网络与CRF技术的道路自动识别方法在审
申请号: | 201810096619.5 | 申请日: | 2018-01-31 |
公开(公告)号: | CN108171220A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 凌志辉;俞旸;徐中恒 | 申请(专利权)人: | 南京云思创智信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 张苏沛 |
地址: | 210042 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 航拍 读取 卷积神经网络 自动识别 视频流 视频 循环神经网络 视频流处理 解码 道路识别 航拍设备 输入图片 周边目标 自动完成 多通道 预测 挂载 路网 算法 迁徙 逼近 录制 图片 保存 飞行 学习 | ||
1.一种基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:
步骤一、获取无人机航拍视频流并对无人机航拍视频进行解码;
步骤二、从无人机航拍视频流中获得航拍图片;
步骤三、读取此输入图片;
步骤四、读取指定模型,若没有指定模型,读取默认模型;
步骤五、对图片进行预测;
步骤六、将预测好的图片以png格式保存。
2.根据权利要求1所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:解码H264视频流,并通过ffmpeg将视频流转化为RGB图像。
3.根据权利要求1所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:
通过多通道全卷积神经网络架构,对航拍图片进行划窗操作分析:首先将航拍图片分割成多个64*64的区域(窗口)块,将64*64的区域块输入全卷积神经网络,输出256个路概率值小数,或是768个路,建筑,非路非建筑概率值小数,256个路概率值对应16*16大小的路标识图片;768个概率值对应16*16大小的路与建筑标识图片。
4.根据权利要求3所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:网络输入为RGB多通道图片。
5.根据权利要求1所述的基于全卷积神经网络与CRF技术的道路自动识别方法,其特征在于:
网络中参数的初始值由夏维初始值(Xavier initialization)获得,损失函数(lossfunction)为交叉熵(cross-entropy),并通过随机梯度下降(stochastic gradientdescent)训练法优化模型参数,由于输入图片为原始图片的一部分导致的边缘信息疏漏与输出不连贯现象导致有必要对输出进行降噪,通过算法会对基于原图片的位移图片进行预测,再使用均值化法来降低划窗操作后生成图片的噪音用来提升道路识别的精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云思创智信息科技有限公司,未经南京云思创智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810096619.5/1.html,转载请声明来源钻瓜专利网。