[发明专利]一种实现地形和目标检测的盲人辅助眼镜有效
申请号: | 201810571715.0 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108960287B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 杨恺伦;程瑞琦;汪凯巍 | 申请(专利权)人: | 杭州视氪科技有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/774;G06V10/764;G06V10/82;A61H3/06 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 黄欢娣;邱启旺 |
地址: | 310000 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 地形 目标 检测 盲人 辅助 眼镜 | ||
1.一种实现地形和目标检测的盲人辅助眼镜,其特征在于,包括眼镜本体,嵌入式安装在其中一个镜腿内的小型处理器和电池模块,固定在镜框上方的一个相机,以及设置在镜腿尾部的耳机模块;所述小型处理器中存储有包含有一个训练好的神经网络;相机、骨传导耳机分别与小型处理器相连,电池模块与小型处理器相连,相机实时地采集周围场景的彩色图像,将彩色图像
所述的神经网络通过以下方法训练得到:
从大型的语义分割数据集中获取训练数据集,包括
以彩色图像
基于神经网络的语义分割模型中每一层网络如下:
第1层是下采样层,输出特征图的维数为16,输出特征图的分辨率为320×240;
第2层是下采样层,输出特征图的维数为64,输出特征图的分辨率为160×120;
第3-7层是一维分解瓶颈层,输出特征图的维数为64,输出特征图的分辨率为160×120;
第8层是下采样层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第9层是扩张卷积率为2的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第10层是扩张卷积率为4的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第11层是扩张卷积率为8的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第12层是扩张卷积率为16的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第13层是扩张卷积率为2的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第14层是扩张卷积率为4的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第15层是扩张卷积率为8的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第16层是扩张卷积率为2的一维分解瓶颈层,输出特征图的维数为128,输出特征图的分辨率为80×60;
第17a层是第16层输出的原始特征图,输出特征图的维数为128,输出特征图的分辨率为80×60;
第17b层是第16层输出的原始特征图的池化和卷积,输出特征图的维数为32,输出特征图的分辨率为80×60;
第17c层是第16层输出的原始特征图的池化和卷积,输出特征图的维数为32,输出特征图的分辨率为40×30;
第17d层是第16层输出的原始特征图的池化和卷积,输出特征图的维数为32,输出特征图的分辨率为20×15;
第17e层是第16层输出的原始特征图的池化和卷积,输出特征图的维数为32,输出特征图的分辨率为10×8;
第17f层是第17a-17e层的上采样和级联,输出特征图的维数为256,输出特征图的分辨率为80×60;
第18层是卷积层,输出特征图的维数为地形和目标类别数,输出特征图的分辨率为80×60;
第19层是上采样层,输出特征图的维数为地形和目标类别数,输出特征图的分辨率为640×480;
其中,所述上采样层采用双线性插值完成;
将待检测的彩色图像
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州视氪科技有限公司,未经杭州视氪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810571715.0/1.html,转载请声明来源钻瓜专利网。