[发明专利]一种音频数据处理方法及装置在审
申请号: | 201910205509.2 | 申请日: | 2019-03-18 |
公开(公告)号: | CN110121102A | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 谢文龙;袁庆宁;李云鹏;沈军 | 申请(专利权)人: | 视联动力信息技术股份有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/8352;G10L21/003 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100000 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频数据 音频包 音频数据处理 终端标识码 多个终端 混音器 混音 数量确定 语音互动 直播业务 数据包 音频源 总音频 上传 终端 申请 | ||
本申请提供了一种音频数据处理方法及装置,其中,所述方法包括:接收多个终端上传的音频数据;其中,所述音频数据包括终端标识码;采用所述多个终端的终端标识码,分别对相应的所述音频数据添加音频源标识,生成多个音频包;根据所述多个音频包的数量确定所需的混音器的个数;分别采用每个所述混音器对所述多个音频包进行混音,生成所述个数的总音频包,从而可以针对每个终端生成不同的混音数据包,实现在直播业务中的多人语音互动。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种音频数据处理方法和一种音频数据处理装置。
背景技术
视联网是网络发展的重要里程碑,是互联网的更高级形态,是一个实时网络,能够实现目前互联网无法实现的全网高清视频实时传输,将众多互联网应用推向高清视频化,高清面对面。最终将实现世界无距离,实现全球范围内人与人的距离只是一个屏幕的距离。
视联网提供了直播业务,在直播平台中,终端可以发布直播数据,也可以收看其他终端的直播。然而目前,当终端用户需要在直播平台中进行互动时,只能进行文字互动或者指定人数的语音互动,而不能实现任意人员的语音互动模式。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种音频数据处理方法及相应的一种音频数据处理装置。
为了解决上述问题,本申请实施例公开了一种音频数据处理方法,所述方法包括:
接收多个终端上传的音频数据;其中,所述音频数据包括终端标识码;
采用所述多个终端的终端标识码,分别对相应的所述音频数据添加音频源标识,生成多个音频包;
根据所述多个音频包的数量确定所需的混音器的个数;
分别采用每个所述混音器对所述多个音频包进行混音,生成所述个数的总音频包。
可选的,所述分别采用每个所述混音器对所述多个音频包进行混音,生成所述个数的总音频包,包括:
分别采用每个所述混音器,对每一终端之外的其他终端的音频包进行混音,生成所述个数的总音频包。
可选的,所述分别采用每个所述混音器,对每一终端之外的其他终端的音频包进行混音,生成所述个数的总音频包,包括:
获取所述多个音频包中的一个音频包作为目标音频包;
提取所述目标音频包的音频源标识;
采用所述个数的混音器中的一个混音器,对所述多个音频包中剔除所述目标音频包后的剩余音频包进行混音,生成目标总音频包,其中,所述目标总音频包携带所述音频源标识。
可选的,还包括:
根据所述多个终端的终端标识码和所述音频源标识建立关联关系;
将所述多个终端和所述关联关系添加到预置终端列表中。
可选的,还包括:
获取所述个数的总音频包中的一个总音频包作为目标总音频包;
提取所述目标总音频包的音频源标识;
采用所述预置终端列表中的关联关系,查找与所述音频源标识对应的目标终端;
将所述目标总音频发送至所述目标终端。
本申请实施例还公开了一种音频数据处理装置,包括:
数据接收模块,用于接收多个终端上传的音频数据;其中,所述音频数据包括终端标识码;
音频包生成模块,用于采用所述多个终端的终端标识码,分别对相应的所述音频数据添加音频源标识,生成多个音频包;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视联动力信息技术股份有限公司,未经视联动力信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910205509.2/2.html,转载请声明来源钻瓜专利网。