[发明专利]机器人、语音数据处理方法、装置以及存储介质有效
申请号: | 202111046909.7 | 申请日: | 2021-09-08 |
公开(公告)号: | CN113496697B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 禤小兵;黄寅 | 申请(专利权)人: | 深圳市普渡科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G01S17/04;B25J9/16;B25J11/00 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 邹航 |
地址: | 518000 广东省深圳市南山区西丽*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 语音 数据处理 方法 装置 以及 存储 介质 | ||
本发明公开了一种机器人、语音数据处理方法、装置以及存储介质,通过对检测区域进行检测,以确定在所述检测区域中是否存在目标物;在确定所述检测区域中存在目标物时,获取机器人采集的语音数据;对所述语音数据进行语音端点检测,以确定所述目标物是否为目标声音源。本发明通过目标物检测以及语音端点检测的方法,实现对目标声音源进行定位,免去通过特定唤醒音频输入来实现声源定位,提升产品在语音交互中的用户体验。
技术领域
本发明涉及语音交互技术领域,尤其涉及一种机器人、语音数据处理方法、装置以及存储介质。
背景技术
语音交互被广泛应用于智能会议、智能客服等场景中,在语音交互的应用过程中,往往需要在嘈杂环境下采集语音信号,此时,环境噪音和室内混响对语音信号的干扰非常大,会导致在对采集得到的语音信号进行分析时,准确率较低。
现有技术中,麦克风阵列能够较为准确地采集语音信号,因此通过麦克风阵列采集语音信号的方式被广泛应用。但是现有麦克风阵列采集语音的方式存在以下不足:需要通过唤醒操作来进行声源定位,在语音交互中用户体验差。
发明内容
本发明实施例提供一种机器人、语音数据处理方法、装置以及存储介质,以解决现有技术中需要通过唤醒操作来进行声源定位,导致语音交互中用户体验差的问题。
一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述机器人上设有传感器;所述处理器执行所述计算机可读指令时实现如下步骤:
对检测区域进行检测,以确定在所述检测区域中是否存在目标物;
在确定所述检测区域中存在目标物时,获取机器人采集的语音数据;
对所述语音数据进行语音端点检测,以确定所述目标物是否为目标声音源;
所述对检测区域进行检测,以确定在所述检测区域中是否存在目标物,包括:
通过所述传感器对所述检测区域进行检测,以获取所述检测区域中的所有特征信息;
确定所述特征信息与预设目标特征信息之间的特征相似度,并将所述特征相似度与预设相似度阈值进行比较;
在所述特征相似度大于或等于所述预设相似度阈值时,确定所述检测区域中存在所述目标物。
一种语音数据处理方法,包括:
对检测区域进行检测,以确定在所述检测区域中是否存在目标物;
在确定所述检测区域中存在目标物时,获取机器人采集的语音数据;
对所述语音数据进行语音端点检测,以确定所述目标物是否为目标声音源;
所述对检测区域进行检测,以确定在所述检测区域中是否存在目标物,包括:
通过设置在所述机器人上的传感器对所述检测区域进行检测,以获取所述检测区域中的所有特征信息;
确定所述特征信息与预设目标特征信息之间的特征相似度,并将所述特征相似度与预设相似度阈值进行比较;
在所述特征相似度大于或等于所述预设相似度阈值时,确定所述检测区域中存在所述目标物。
一种语音数据处理装置,包括:
目标物检测模块,用于对检测区域进行检测,以确定在所述检测区域中是否存在目标物;
语音数据获取模块,用于在确定所述检测区域中存在目标物时,获取机器人采集的语音数据;
语音端点检测模块,用于对所述语音数据进行语音端点检测,以确定所述目标物是否为目标声音源;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市普渡科技有限公司,未经深圳市普渡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111046909.7/2.html,转载请声明来源钻瓜专利网。