[发明专利]语音播放方法和装置、存储介质及电子设备在审

申请号：	202010395783.3	申请日：	2020-05-12
公开（公告）号：	CN113657134A	公开（公告）日：	2021-11-16
发明（设计）人：	孙浚凯	申请（专利权）人：	北京地平线机器人技术研发有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G10L15/22;G06F40/216;G06F40/289;G06F40/30
代理公司：	北京布瑞知识产权代理有限公司 11505	代理人：	王海臣
地址：	100094 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音播放方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音播放方法，包括：

检测目标对象的行为以及确定所述目标对象的种类；

基于所述目标对象的行为，检测驾驶员的行为；

基于所述驾驶员的行为，控制发声器播放与所述目标对象的种类相一致的安抚语音。

2.根据权利要求1所述的方法，其中，所述检测目标对象的行为包括：

对采集到的包含目标对象声音的声音信号进行声强检测；

对采集到的包含所述目标对象的视频图像进行动作特征提取得到所述目标对象的动作特征；

基于检测到的声强值与强度阈值、所述动作特征的变化频率与频率阈值，确定所述目标对象的行为。

3.根据权利要求2所述的方法，其中，所述对采集到的包含目标对象声音的声音信号进行声强检测包括：

获取采集到的包含目标对象声音的声音信号；

从所述声音信号中分离出所述目标对象声音；

对所述目标对象声音进行声强检测。

4.根据权利要求3所述的方法，其中，从所述声音信号中分离出所述目标对象声音包括：

采用盲源分离技术从所述声音信号中分离出所述目标对象声音。

5.根据权利要求2所述的方法，其中，对采集到的包含所述目标对象的视频图像进行动作特征提取得到所述目标对象的动作特征包括：

获取采集到的包含所述目标对象的视频图像；

从所述视频图像中分离出所述目标对象所在的第一图像区域；

对所述第一图像区域进行局部特征提取，得到所述目标对象的局部时空特征点数据；

在所述基于检测到的声强值与强度阈值、所述动作特征的变化频率与频率阈值，确定所述目标对象的行为之前，还包括：

根据所述局部时空特征点数据中坐标值的变化频率确定所述动作特征的变化频率。

6.根据权利要求1所述的方法，其中，所述检测驾驶员的行为包括：

对采集到的包含所述驾驶员的视频图像分别进行表情特征提取和动作特征提取，得到所述驾驶员的表情特征和动作特征；

基于所述驾驶员的表情特征识别出所述驾驶员的表情；

基于所述驾驶员的动作特征识别出所述驾驶员的动作；

当所述驾驶员的表情为预设急躁表情和所述驾驶员的动作为预设安抚动作时，确定所述驾驶员的行为为预设安抚行为。

7.根据权利要求1所述的方法，其中，在所述控制发生器播放与所述目标对象的种类相一致的安抚语音之前，还包括：

控制发生器将采集到的驾驶员发出的安抚语音模拟成与所述目标对象的种类相一致的安抚语音。

8.一种语音播放装置，包括：

确定模块，用于确定目标对象的种类；

第一检测模块，用于检测所述目标对象的行为；

第二检测模块，用于基于所述目标对象的行为，检测驾驶员的行为；

控制模块，用于基于所述驾驶员的行为，控制发声器播放与所述目标对象的种类相一致的安抚语音。

9.一种计算机可读存储介质，其中，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1-7中任一项所述的语音播放方法。

10.一种电子设备，包括：

处理器；以及

用于存储所述处理器可执行指令的存储器；

其中，所述处理器用于执行上述权利要求1-7中任一项所述的语音播放方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司，未经北京地平线机器人技术研发有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010395783.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种智能穿戴产品用光学玻璃的生产工艺
下一篇：一种水下壁面清洗机器人两自由度大空间工作装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音播放方法和装置、存储介质及电子设备在审

专利文献下载