[发明专利]即时通信应用中的语音数据处理方法、装置及电子设备在审

申请号：	202010956303.6	申请日：	2020-09-11
公开（公告）号：	CN112750456A	公开（公告）日：	2021-05-04
发明（设计）人：	梁俊斌	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L21/043	分类号：	G10L21/043;G10L21/057;G10L25/63;G10L21/02;G10L25/18
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	李娟
地址：	518044 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	即时通信应用中的语音数据处理方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种即时通信应用中的语音数据处理方法、装置及电子设备，属于语音处理技术领域。本申请实施例中，语音接收侧上的即时通讯应用显示接收到的语音消息；响应播放语音消息的操作，根据播放环境的第一噪声强度对语音消息的播放语速进行调节后播放，其中播放语速和第一噪声强度负相关；语音发送侧上的即时通讯应用响应目标对象触发的录音操作，获得麦克风采集的语音数据；根据录音环境的第二噪声强度对语音数据进行处理后发送，其中播放语速和第二噪声强度负相关。由于本申请实施例根据检测噪声大小调节语速，噪声越大，调节后的语音数据的播放语速越慢，不再需要用户手动调节播放音量，提高语音消息的播放控制方式的灵活性。

技术领域

本申请涉及语音处理技术领域，特别涉及一种即时通信应用中的语音数据处理方法、装置及电子设备。

背景技术

随着信息技术的日益发展，各种社交APP的语音功能越发完善，如今无论你人身在何处，我们日常的线上沟通都不再需要打字输入，通过即时通讯APP以语音消息的形式发送信息，沟通越来越方便。

目前，即时通讯APP接收到语音消息，用户点击播放接收到的语音消息，并从存储单元里读取该语音消息并进行解码，解码后得到可播放的pcm音频数据，最后由播放器播放该pcm音频数据，从而用户可以听到接收的语音消息。在即时通讯APP播放语音消息的过程中，若当前播放环境中噪声较大(例如播放环境为噪声较大的户外环境)，用户可能无法听清楚播放的语音消息，此时需要用户手动调节播放音量，语音消息播放过程中的播放控制方式不够灵活。

发明内容

本申请实施例提供一种即时通信应用中的语音数据处理方法，用以提高播放过程中的播放控制方式的灵活性。

第一方面，本申请实施例提供一种即时通信应用中的语音数据处理方法，包括：

显示接收到的语音消息；

响应播放所述语音消息的操作，根据播放环境的第一噪声强度对所述语音消息的播放语速进行调节后播放，所述播放语速和所述第一噪声强度负相关。

可选地，根据下列方式检测带噪语音数据中的第一噪声强度：

针对所述带噪语音数据中的每个带噪语音数据帧，对所述带噪语音数据帧进行噪声检测，得到所述带噪语音数据帧对应的噪声估计参数；

根据所述带噪语音数据中的带噪语音数据帧对应的噪声估计参数确定所述第一噪声强度。

可选地，根据下列方式确定所述带噪语音数据帧对应的噪声估计参数：

确定所述带噪语音数据帧对应的在预设频谱范围内的目标子带；

根据每个目标子带对应的噪声估计值、每个目标子带中包含的频点个数，以及采集到的上一个带噪语音数据帧对应的噪声估计参数，确定所述带噪语音数据帧对应的噪声估计参数。

可选地，根据下列方式确定每个目标子带对应的噪声估计值：