[发明专利]音频传输方法、装置及计算机存储介质在审
申请号: | 201911404049.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN113066504A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 张宏升;吴丹;高瑞;苗伟斌 | 申请(专利权)人: | 上海汽车集团股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/028;G10L17/00 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 201804 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 传输 方法 装置 计算机 存储 介质 | ||
本申请实施例提供一种音频传输方法、装置及计算机存储介质。该音频传输方法包括:对预设范围内n个音区的音频数据进行声纹提取,得到m个声纹,n为大于1的整数,m为大于0的整数,且m小于或等于n;在m个声纹中确定目标声纹,目标声纹用于指示目标通话人的声音特征;在n个音区中确定目标声纹对应的目标音区;传输目标音区的音频数据。本申请实施例对音频数据的声纹特征进行分析,确定目标声纹,进而确定与目标声纹对应的目标音区,将目标音区的音频数据传送给对方,使得当车内有多人同时说话时,传送给对方的音频数据是目标音区的音频数据,不会包含车内其他人的声音,提高用户体验。
技术领域
本申请实施例涉及电子信息技术领域,尤其涉及一种音频传输方法、装置及计算机存储介质。
背景技术
随着终端技术的不断发展,终端所提供的语音通话、电话会议或视频通话的功能逐渐普及,例如,车载娱乐系统支持的蓝牙通话。
现有技术,车内设置麦克风,在语音通话过程中,麦克风收集车内的声音,并将收集到的声音发送到车载系统,车载系统将音频传送给对方。
然而,当车内有多人同时说话时,传送给对方的音频会包含车内其他人的声音,用户体验不佳。
发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供音频传输方法、装置及计算机存储介质,用以克服现有技术中当车内有多人同时说话时,传送给对方的音频会包含车内其他人的声音,用户体验不佳的缺陷。
第一方面,本申请实施例提供了一种音频传输方法,方法包括:
对预设范围内n个音区的音频数据进行声纹提取,得到m个声纹,n为大于1的整数,m为大于0的整数,且m小于或等于n;
在m个声纹中确定目标声纹,目标声纹用于指示目标通话人的声音特征;
在n个音区中确定目标声纹对应的目标音区;
传输目标音区的音频数据。
可选地,在本申请的一个实施例中,从m个声纹中确定目标声纹,包括:
将m个声纹与预设声纹进行比对;
将m个声纹中与预设声纹一致的声纹确定为目标声纹。
可选地,在本申请的一个实施例中,传输目标音区的音频数据,包括:
对目标音区的音频数据进行声纹提取,得到目标音区对应的声纹,如果目标音区对应的声纹与目标声纹一致,传输目标音区的音频数据。
可选地,在本申请的一个实施例中,方法还包括:
如果目标音区对应的声纹与目标声纹不一致,在n个音区中将目标声纹对应的音区确定为新的目标音区,传输新的目标音区的音频数据。
可选地,在本申请的一个实施例中,方法还包括:
生成并传输语音命令,并在预设范围内获取n个音区的音频数据,语音命令用于指示在预设范围内保持通话人的数量为1。
可选地,在本申请的一个实施例中,方法还包括:
接收切换请求信息后,在预设范围内获取n个音区的音频数据,切换请求信息用于指示更换通话人。
可选地,在本申请的一个实施例中,方法还包括:
通过麦克风阵列采集预设范围内n个音区的音频数据。
第二方面,本申请实施例提供了一种语音通话装置,装置包括:声纹分析模块、确定目标声纹模块、确定目标音区模块、传输模块;
声纹分析模块,用于对预设范围内n个音区的音频数据进行声纹提取,得到m个声纹,n为大于1的整数,m为大于0的整数,且m小于或等于n;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海汽车集团股份有限公司,未经上海汽车集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404049.2/2.html,转载请声明来源钻瓜专利网。