[发明专利]一种声音信号记录系统有效
申请号: | 202010251561.4 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111429916B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 刘佳;黄海;隆弢;陈龙 | 申请(专利权)人: | 西安声联科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L21/028;H04N21/231;H04N21/233;H04N21/845 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张秀程 |
地址: | 710077 陕西省西安市高新区丈八*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 信号 记录 系统 | ||
1.一种声音信号记录系统,其特征在于,包括拾音器、记录设备和语音识别转写服务器;
所述拾音器用于接收第一声源和第二声源的混合声音信号;
将所述混合声音信号划分为预设帧长的语音帧;
根据所述语音帧对应的传播方向从混合声音信号中实时分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号;
所述记录设备用于分别将来自所述第一声源的声音信号和来自所述第二声源的声音信号发送到所述语音识别转写服务器;
所述语音识别转写服务器实时根据来自所述第一声源的声音信号确定第一转写文本,实时根据来自所述第二声源的声音信号确定第二转写文本,并将所述第一转写文本和所述定第二转写文本发送到所述记录设备;
所述记录设备存储所述第一转写文本和所述定第二转写文本;
其中,所述拾音器、所述记录设备和所述语音识别转写服务器处于同一局域网覆盖范围内。
2.根据权利要求1所述的声音信号记录系统,其特征在于,
所述拾音器还用于通过波束形成算法和降噪算法,分别将来自所述第一声源的声音信号和来自所述第二声源的声音信号进行增强;
所述记录设备还用于,将增强后所述第一声源的声音信号分割成媒体切片后,发送到所述语音识别转写服务器,并将增强后所述第二声源的声音信号分割成媒体切片后,发送到所述语音识别转写服务器;
所述语音识别转写服务器用于接收与所述第一声源的声音信号对应的媒体切片,根据与所述第一声源对应的媒体切片得到所述第一声源的声音信号,将所述第一声源的声音信号转写为文字,得到所述第一转写文本,并接收与所述第二声源的声音信号对应的媒体切片,根据与所述第二声源对应的媒体切片得到所述第二声源的声音信号,将所述第二声源的声音信号转写为文字,得到所述第二转写文本。
3.根据权利要求2所述的声音信号记录系统,其特征在于,
所述语音识别转写服务器还用于将所述第一声源的声音信号输入预先训练的语言模型,将由所述语言模型根据所述第一声源的声音信号,输出的文字作为所述第一转写文本;
所述语音识别转写服务器还用于将所述第二声源的声音信号输入预先训练的语言模型,将由所述语言模型根据所述第二声源的声音信号,输出的文字作为所述第二转写文本;
其中,所述语言模型为预先根据样本声音信号,以及与样本声音信号对应的转写文本为标签进行训练得到。
4.根据权利要求1所述的声音信号记录系统,其特征在于,所述拾音器包括麦克风阵列单元、处理单元和输出单元;所述麦克风阵列单元包括麦克风阵列和音频编码单元;
所述麦克风阵列单元用于将采集的所述混合声音信号发送到处理单元;
所述处理单元用于从第一声源和第二声源的混合声音信号中,分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号,将来自所述第一声源的声音信号和来自所述第二声源的声音信号分别发送到所述输出单元;
所述输出单元用于分别输出来自所述第一声源的声音信号和来自所述第二声源的声音信号;
其中,所述音频编码单元用于将麦克风阵列接收的声波转化为电信号,得到声音信号。
5.根据权利要求4所述的声音信号记录系统,其特征在于,所述处理单元具体用于:
接收来自第一声源和第二声源的混合声音信号;
将接收的混合声音信号划分为预设帧长的语音帧,对每一语音帧进行传播方向判断,确定每一语音帧对应的传播方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安声联科技有限公司,未经西安声联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251561.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频推荐方法及装置
- 下一篇:一种双声源的声音信号分离方法和拾音器