[发明专利]基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法在审
申请号: | 201910909431.2 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110728308A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 彭文杰;余菲;林坤阳;林泽锋;郑东润;范智博;罗家祥 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G10L13/04;G10L15/22;G10L15/26 |
代理公司: | 44245 广州市华学知识产权代理有限公司 | 代理人: | 林梅繁 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机视觉与语音识别技术领域,涉及一种基于改进Yolov2目标检测和语音识别的交互式导盲系统及方法。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、数据处理和信号传递,其上部署有交互式导盲系统的控制软件,包括:目标检测单元、语音识别单元和道路规划单元;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本发明能辅助盲人更好地生活,提高盲人的生活质量。 | ||
搜索关键词: | 中央处理器 导盲系统 语音合成装置 麦克风 道路规划 深度相机 高端 电源 中央处理器输出 目标检测单元 用户语音信息 语音识别单元 语音识别技术 计算机视觉 控制软件 目标检测 图像采集 系统控制 信号传递 语音识别 语音信息 数据处理 深度图 寻物 合成 采集 场景 供电 播放 部署 改进 | ||
【主权项】:
1.基于改进Yolov2的目标检测和语音识别的交互式导盲系统,其特征在于,包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:/n中央处理器:用于系统控制、数据处理和信号传递;所述中央处理器上部署有交互式导盲系统的控制软件,包括:目标检测单元、语音识别单元和道路规划单元;/n深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;/n高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;/n麦克风:用于采集用户语音信息,并将采集的用户语音信息传送给所述中央处理器;/n电源:用于给所述中央处理器供电。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910909431.2/,转载请声明来源钻瓜专利网。