[发明专利]实现对象音频录音的方法及装置、电子设备有效
申请号: | 201510490373.6 | 申请日: | 2015-08-11 |
公开(公告)号: | CN105070304B | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 史润宇;颜嘉甫;杜慧 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031;G10L21/028 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 对象 音频 录音 方法 装置 电子设备 | ||
本公开是关于实现对象音频录音的方法及装置、电子设备,该方法可以包括:通过多个麦克风同时执行声音采集操作,得到混合声音信号;根据所述混合声音信号,以及每个麦克风的设置位置信息,从所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每个声源的对象声音信号;组合各个声源的位置信息和对象声音信号,得到对象音频格式的音频数据。通过本公开的技术方案,可以实现对象音频的直接录音。
技术领域
本公开涉及录音技术领域,尤其涉及实现对象音频录音的方法及装置、电子设备。
背景技术
2015年2月,MPEG(Moving Picture Experts Group,动态图像专家组)的下一代音频编解码标准MPEG-H 3D Audio正式成为ISO/IEC 23008-3国际标准,在这个标准框架中使用了一种全新的音频格式——对象音频(Object Audio),可以标记声音的方位,使听者无论是用耳机还是音响、无论音响的喇叭数是多少,都可以听到特定方位传来的声音。
发明内容
本公开提供实现对象音频录音的方法及装置、电子设备,以解决相关技术中的不足。
根据本公开实施例的第一方面,提供一种实现对象音频录音的方法,包括:
通过多个麦克风同时执行声音采集操作,得到混合声音信号;
根据所述混合声音信号,以及每个麦克风的设置位置信息,从所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每个声源的对象声音信号;
组合各个声源的位置信息和对象声音信号,得到对象音频格式的音频数据。
可选的,所述根据所述混合声音信号,以及每个麦克风的设置位置信息,从所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每个声源的对象声音信号,包括:
根据每个声源发出的声音信号在各个麦克风之间形成的幅度差与相位差,从所述混合声音信号中识别出声源数量和每个声源的位置信息,并分离出对应于每个声源的对象声音信号。
可选的,所述根据所述混合声音信号,以及每个麦克风的设置位置信息,从所述混合声音信号中识别出声源数量、每个声源的位置信息,并分离出对应于每个声源的对象声音信号,包括:
根据所述混合声音信号,以及每个麦克风的设置位置信息,从所述混合声音信号中识别出声源数量和每个声源的位置信息;
根据所述混合声音信号,每个麦克风的设置位置信息,以及所述声源数量和所述声源的位置信息,从所述混合声音信号中分离出对应于每个声源的对象声音信号。
可选的,所述根据所述混合声音信号,每个麦克风的设置位置信息,以及所述声源数量和所述声源的位置信息,从所述混合声音信号中分离出对应于每个声源的对象声音信号,包括:
根据每个声源发出的声音信号在预设维度形成的特征量,建立对应的统计模型;
通过所述统计模型识别并分离出所述混合声音信号中符合任一声源的位置信息的声音信号,作为对应于所述任一声源的对象声音信号。
可选的,所述组合各个声源的位置信息和对象声音信号,得到对象音频格式的音频数据,包括:
按照各个声源之间的排列顺序,对相应的对象声音信号进行组合,得到多对象音频数据;
按照所述排列顺序对各个声源的位置信息进行组合,得到对象音频辅助数据;
将包含预设参数的头文件信息、所述多对象音频数据和所述对象音频辅助数据进行依次拼接,得到所述对象音频格式的音频数据。
可选的,所述组合每个声源的位置信息和对象声音信号,得到对象音频格式的音频数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510490373.6/2.html,转载请声明来源钻瓜专利网。