[发明专利]基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法在审

申请号：	201910909431.2	申请日：	2019-09-25
公开（公告）号：	CN110728308A	公开（公告）日：	2020-01-24
发明（设计）人：	彭文杰;余菲;林坤阳;林泽锋;郑东润;范智博;罗家祥	申请（专利权）人：	华南理工大学
主分类号：	G06K9/62	分类号：	G06K9/62;G10L13/04;G10L15/22;G10L15/26
代理公司：	44245 广州市华学知识产权代理有限公司	代理人：	林梅繁
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于计算机视觉与语音识别技术领域，涉及一种基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源，其中：中央处理器：用于系统控制、数据处理和信号传递，其上部署有交互式导盲系统的控制软件，包括：目标检测单元、语音识别单元和道路规划单元；深度相机：用于对当前场景进行图像采集，生成RGB图像与深度图；高端语音合成装置：用于对所述中央处理器输出的语音信息进行合成，播放寻物结果或道路规划情况；麦克风：用于采集用户语音信息，并传送给中央处理器；电源：用于给所述中央处理器供电。本发明能辅助盲人更好地生活，提高盲人的生活质量。
搜索关键词：	中央处理器导盲系统语音合成装置麦克风道路规划深度相机高端电源中央处理器输出目标检测单元用户语音信息语音识别单元语音识别技术计算机视觉控制软件目标检测图像采集系统控制信号传递语音识别语音信息数据处理深度图寻物合成采集场景供电播放部署改进
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于改进Yolov2的目标检测和语音识别的交互式导盲系统，其特征在于，包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源，其中：/n中央处理器：用于系统控制、数据处理和信号传递；所述中央处理器上部署有交互式导盲系统的控制软件，包括：目标检测单元、语音识别单元和道路规划单元；/n深度相机：用于对当前场景进行图像采集，生成RGB图像与深度图；/n高端语音合成装置：用于对所述中央处理器输出的语音信息进行合成，播放寻物结果或道路规划情况；/n麦克风：用于采集用户语音信息，并将采集的用户语音信息传送给所述中央处理器；/n电源：用于给所述中央处理器供电。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910909431.2/，转载请声明来源钻瓜专利网。

上一篇：自生成数据集与标签实现X光影像图小样本字符识别方法
下一篇：一种基于铁路信号与北斗定位的行车轨迹聚类方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法在审

专利文献下载