[发明专利]一种基于ROS的智能机器人语音交互系统及交互方法在审
申请号: | 202110035380.2 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112863522A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 蒋畅江;刘俊良 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/22;G10L13/027;G10L15/22;G10L15/30 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 陈栋梁 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ros 智能 机器人 语音 交互 系统 方法 | ||
1.一种基于ROS的智能机器人语音交互系统,其特征在于,用于同时实现离线和在线的语音交互,包括:语音唤醒模块、语音识别模块、语义理解模块及语音合成模块,其中语音唤醒模块通过识别唤醒词的方式,对机器人进行唤醒,使机器人从休眠状态进入工作状态。语音识别模块是将接收到的语音信号解析成语音字符串,语义理解模块将语音识别解析出的语音字符串进行语义理解,并将结果同样以字符串的方式返回,语音合成模块将之前得到的语音字符串合成为语音。
2.一种基于权利要求1所述系统的交互方法,其特征在于,包括以下步骤:
离线状态下:
S1:语音唤醒模块利用PocketSphinx语音识别系统进行本地处理:首先在代码中,添加需要的ROS机器人操作系统接口,此接口包括自己设备的用户名,密码和登录参数等,使得自己的设备和代码相匹配,并在代码中添加订阅唤醒语音识别的信号,即唤醒词,通过识别结果与唤醒词的匹配,从而实现语音唤醒功能;
S2:由科大讯飞离线命令词识别SDK软件开发工具包进行本地处理:将科大讯飞离线命令词识别SDK软件开发工具包集成到自己的机器人,此过程是将接收到的操作指令与创建的标签中的“命令词”进行匹配,并做出相应反馈;
S3:利用科大讯飞离线TTS(文本到语音)语音包实现离线语音合成,从而实现离线的语音交互。
3.根据权利要求2所述的交互方法,其特征在于,所述步骤S1具体包括以下步骤:首先在代码中,添加需要的ROS(机器人操作系统)接口。并在代码中添加订阅唤醒语音识别的信号,即唤醒词;然后调用PocketSphinx语音识别系统中的节点recognizer.py文件,然后该文件通过机器人上的麦克风收集唤醒机器人的语音指令,接着调用ROS系统中自带的语音识别库进行识别,并得出相应的文本信息,通过/recognizer/output消息进行发布,语音唤醒节点通过订阅该消息获取识别结果,与设置的唤醒词进行比对,基于此判断是否唤醒机器人,机器人被唤醒以后,将设备从休眠状态激活至运行状态。
4.根据权利要求2所述的交互方法,其特征在于,在线状态下包括以下步骤:
A1:语音唤醒模块利用PocketSphinx语音识别系统进行本地处理:首先在代码中,添加需要的ROS机器人操作系统接口,并在代码中添加订阅唤醒语音识别的信号,从而实现语音唤醒功能;
A2:语音识别模块由科大讯飞在线语音识别SDK软件开发工具包进行本地处理:将科大讯飞在线语音识别SDK软件开发工具包集成到自己的机器人上,此过程将接收到的语音信号解析成语音字符串;
A3:语音理解由图灵服务器在线语义理解进行在线处理:首先在图灵服务器上添加自己机器人的接口地址,然后将语音识别出的字符串发送到图灵服务器,通过服务器进行语义理解,并且将结果同样以字符串的方式返回;
A4:语音合成模块由科大讯飞在线语音合成SDK软件开发工具包进行在线合成,操作流程就是将科大讯飞在线语音识别SDK软件开发工具包集成到自己的机器人上,此过程是将接收到的语音字符串转换成语音。
5.根据权利要求4所述的交互方法,其特征在于,所述步骤A4将语音指令识别生成的对应的字符串,通过语音控制节点订阅语音识别发布的消息,然后根据消息中的具体指令发布速度控制指令、转向指令,机器人接收到具体的指令以后,就实现了通过语音来控制机器人移动的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110035380.2/1.html,转载请声明来源钻瓜专利网。