[发明专利]即时通信应用中的语音数据处理方法、装置及电子设备在审
申请号: | 202010956303.6 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112750456A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/043 | 分类号: | G10L21/043;G10L21/057;G10L25/63;G10L21/02;G10L25/18 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 即时 通信 应用 中的 语音 数据处理 方法 装置 电子设备 | ||
本申请提供一种即时通信应用中的语音数据处理方法、装置及电子设备,属于语音处理技术领域。本申请实施例中,语音接收侧上的即时通讯应用显示接收到的语音消息;响应播放语音消息的操作,根据播放环境的第一噪声强度对语音消息的播放语速进行调节后播放,其中播放语速和第一噪声强度负相关;语音发送侧上的即时通讯应用响应目标对象触发的录音操作,获得麦克风采集的语音数据;根据录音环境的第二噪声强度对语音数据进行处理后发送,其中播放语速和第二噪声强度负相关。由于本申请实施例根据检测噪声大小调节语速,噪声越大,调节后的语音数据的播放语速越慢,不再需要用户手动调节播放音量,提高语音消息的播放控制方式的灵活性。
技术领域
本申请涉及语音处理技术领域,特别涉及一种即时通信应用中的语音数据处理方法、装置及电子设备。
背景技术
随着信息技术的日益发展,各种社交APP的语音功能越发完善,如今无论你人身在何处,我们日常的线上沟通都不再需要打字输入,通过即时通讯APP以语音消息的形式发送信息,沟通越来越方便。
目前,即时通讯APP接收到语音消息,用户点击播放接收到的语音消息,并从存储单元里读取该语音消息并进行解码,解码后得到可播放的pcm音频数据,最后由播放器播放该pcm音频数据,从而用户可以听到接收的语音消息。在即时通讯APP播放语音消息的过程中,若当前播放环境中噪声较大(例如播放环境为噪声较大的户外环境),用户可能无法听清楚播放的语音消息,此时需要用户手动调节播放音量,语音消息播放过程中的播放控制方式不够灵活。
发明内容
本申请实施例提供一种即时通信应用中的语音数据处理方法,用以提高播放过程中的播放控制方式的灵活性。
第一方面,本申请实施例提供一种即时通信应用中的语音数据处理方法,包括:
显示接收到的语音消息;
响应播放所述语音消息的操作,根据播放环境的第一噪声强度对所述语音消息的播放语速进行调节后播放,所述播放语速和所述第一噪声强度负相关。
可选地,根据下列方式检测带噪语音数据中的第一噪声强度:
针对所述带噪语音数据中的每个带噪语音数据帧,对所述带噪语音数据帧进行噪声检测,得到所述带噪语音数据帧对应的噪声估计参数;
根据所述带噪语音数据中的带噪语音数据帧对应的噪声估计参数确定所述第一噪声强度。
可选地,根据下列方式确定所述带噪语音数据帧对应的噪声估计参数:
确定所述带噪语音数据帧对应的在预设频谱范围内的目标子带;
根据每个目标子带对应的噪声估计值、每个目标子带中包含的频点个数,以及采集到的上一个带噪语音数据帧对应的噪声估计参数,确定所述带噪语音数据帧对应的噪声估计参数。
可选地,根据下列方式确定每个目标子带对应的噪声估计值:
根据所述目标子带中每个频点对应的频域复数值以及所述目标子带中包含的频点个数,确定所述目标子带的功率谱;其中,所述频点对应的频域复数值是将采集到的所述带噪语音数据帧进行傅里叶变换处理得到的;
根据对所述目标子带的功率谱做时频域平滑处理得到的平滑功率谱,以及根据所述带噪语音数据帧对应的子带的功率谱中的最小功率谱,确定所述目标子带对应的语音存在概率值;
根据所述目标子带对应的功率谱、所述目标子带对应的语音存在概率值,以及所述目标子带在上一个带噪语音数据帧中对应的噪声估计值,确定所述目标子带对应的噪声估计值。
可选地,在根据播放环境的第一噪声强度对所述语音消息的播放语速进行调节之前,还包括:
对所述语音消息进行语音增强处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010956303.6/2.html,转载请声明来源钻瓜专利网。