[发明专利]实现对象音频录音的方法及装置、电子设备有效

申请号：	201510490373.6	申请日：	2015-08-11
公开（公告）号：	CN105070304B	公开（公告）日：	2018-09-04
发明（设计）人：	史润宇;颜嘉甫;杜慧	申请（专利权）人：	小米科技有限责任公司
主分类号：	G11B27/031	分类号：	G11B27/031;G10L21/028
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	林祥
地址：	100085 北京市海淀区清***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	实现对象音频录音方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于实现对象音频录音的方法及装置、电子设备，该方法可以包括：通过多个麦克风同时执行声音采集操作，得到混合声音信号；根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。通过本公开的技术方案，可以实现对象音频的直接录音。

技术领域

本公开涉及录音技术领域，尤其涉及实现对象音频录音的方法及装置、电子设备。

背景技术

2015年2月，MPEG(Moving Picture Experts Group，动态图像专家组)的下一代音频编解码标准MPEG-H 3D Audio正式成为ISO/IEC 23008-3国际标准，在这个标准框架中使用了一种全新的音频格式——对象音频(Object Audio)，可以标记声音的方位，使听者无论是用耳机还是音响、无论音响的喇叭数是多少，都可以听到特定方位传来的声音。

发明内容

本公开提供实现对象音频录音的方法及装置、电子设备，以解决相关技术中的不足。

根据本公开实施例的第一方面，提供一种实现对象音频录音的方法，包括：

通过多个麦克风同时执行声音采集操作，得到混合声音信号；

根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号；

组合各个声源的位置信息和对象声音信号，得到对象音频格式的音频数据。

可选的，所述根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量、每个声源的位置信息，并分离出对应于每个声源的对象声音信号，包括：

根据每个声源发出的声音信号在各个麦克风之间形成的幅度差与相位差，从所述混合声音信号中识别出声源数量和每个声源的位置信息，并分离出对应于每个声源的对象声音信号。

根据所述混合声音信号，以及每个麦克风的设置位置信息，从所述混合声音信号中识别出声源数量和每个声源的位置信息；

根据所述混合声音信号，每个麦克风的设置位置信息，以及所述声源数量和所述声源的位置信息，从所述混合声音信号中分离出对应于每个声源的对象声音信号。

可选的，所述根据所述混合声音信号，每个麦克风的设置位置信息，以及所述声源数量和所述声源的位置信息，从所述混合声音信号中分离出对应于每个声源的对象声音信号，包括：

根据每个声源发出的声音信号在预设维度形成的特征量，建立对应的统计模型；