[发明专利]一种基于ROS的智能机器人语音交互系统及交互方法在审

申请号：	202110035380.2	申请日：	2021-01-12
公开（公告）号：	CN112863522A	公开（公告）日：	2021-05-28
发明（设计）人：	蒋畅江;刘俊良	申请（专利权）人：	重庆邮电大学
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/22;G10L13/027;G10L15/22;G10L15/30
代理公司：	重庆市恒信知识产权代理有限公司 50102	代理人：	陈栋梁
地址：	400065 重***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 ros 智能机器人语音交互系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于ROS的智能机器人语音交互系统，其特征在于，用于同时实现离线和在线的语音交互，包括：语音唤醒模块、语音识别模块、语义理解模块及语音合成模块，其中语音唤醒模块通过识别唤醒词的方式，对机器人进行唤醒，使机器人从休眠状态进入工作状态。语音识别模块是将接收到的语音信号解析成语音字符串，语义理解模块将语音识别解析出的语音字符串进行语义理解，并将结果同样以字符串的方式返回，语音合成模块将之前得到的语音字符串合成为语音。

2.一种基于权利要求1所述系统的交互方法，其特征在于，包括以下步骤：

离线状态下：

S1：语音唤醒模块利用PocketSphinx语音识别系统进行本地处理：首先在代码中，添加需要的ROS机器人操作系统接口，此接口包括自己设备的用户名，密码和登录参数等，使得自己的设备和代码相匹配，并在代码中添加订阅唤醒语音识别的信号，即唤醒词，通过识别结果与唤醒词的匹配，从而实现语音唤醒功能；

S2：由科大讯飞离线命令词识别SDK软件开发工具包进行本地处理：将科大讯飞离线命令词识别SDK软件开发工具包集成到自己的机器人，此过程是将接收到的操作指令与创建的标签中的“命令词”进行匹配，并做出相应反馈；

S3：利用科大讯飞离线TTS(文本到语音)语音包实现离线语音合成，从而实现离线的语音交互。

3.根据权利要求2所述的交互方法，其特征在于，所述步骤S1具体包括以下步骤：首先在代码中，添加需要的ROS(机器人操作系统)接口。并在代码中添加订阅唤醒语音识别的信号，即唤醒词；然后调用PocketSphinx语音识别系统中的节点recognizer.py文件，然后该文件通过机器人上的麦克风收集唤醒机器人的语音指令，接着调用ROS系统中自带的语音识别库进行识别，并得出相应的文本信息，通过/recognizer/output消息进行发布，语音唤醒节点通过订阅该消息获取识别结果，与设置的唤醒词进行比对，基于此判断是否唤醒机器人,机器人被唤醒以后，将设备从休眠状态激活至运行状态。

4.根据权利要求2所述的交互方法，其特征在于，在线状态下包括以下步骤：

A1：语音唤醒模块利用PocketSphinx语音识别系统进行本地处理：首先在代码中，添加需要的ROS机器人操作系统接口，并在代码中添加订阅唤醒语音识别的信号，从而实现语音唤醒功能；

A2：语音识别模块由科大讯飞在线语音识别SDK软件开发工具包进行本地处理：将科大讯飞在线语音识别SDK软件开发工具包集成到自己的机器人上，此过程将接收到的语音信号解析成语音字符串；

A3：语音理解由图灵服务器在线语义理解进行在线处理：首先在图灵服务器上添加自己机器人的接口地址，然后将语音识别出的字符串发送到图灵服务器，通过服务器进行语义理解，并且将结果同样以字符串的方式返回；

A4：语音合成模块由科大讯飞在线语音合成SDK软件开发工具包进行在线合成，操作流程就是将科大讯飞在线语音识别SDK软件开发工具包集成到自己的机器人上，此过程是将接收到的语音字符串转换成语音。

5.根据权利要求4所述的交互方法，其特征在于，所述步骤A4将语音指令识别生成的对应的字符串，通过语音控制节点订阅语音识别发布的消息，然后根据消息中的具体指令发布速度控制指令、转向指令，机器人接收到具体的指令以后，就实现了通过语音来控制机器人移动的目的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆邮电大学，未经重庆邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110035380.2/1.html，转载请声明来源钻瓜专利网。

上一篇：风机系统及应用该风机系统的吸油烟机
下一篇：一种微流控装置、搅拌系统以及搅拌方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于ROS的智能机器人语音交互系统及交互方法在审

专利文献下载