[发明专利]语音转录设备、系统、方法、及电子设备在审
申请号: | 201811004661.6 | 申请日: | 2018-08-30 |
公开(公告)号: | CN110875056A | 公开(公告)日: | 2020-03-10 |
发明(设计)人: | 余涛;许云峰;刘章 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/78;G10L21/0208;H04N5/76 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 转录 设备 系统 方法 电子设备 | ||
本申请公开了语音转录设备、系统和方法,以及电子设备。其中,语音转录设备,通过传声器阵列采集阵列接收范围内的语音信号;若所述语音信号包括话音信号,则确定所述话音信号的声源位置;若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;将所述目标话音信号发送至语音转录服务器,以使得所述服务器对所述目标话音信号进行语音转录。采用这种处理方式,使得基于传声器阵列对拾音区域内的话音信号进行多麦克增强,同时根据声源位置判断是否是目标话音,对于目标区域外的声音进行过滤,保证区域外声音不会传入到转录服务器;因此,可以有效确保拾到目标话音,提升对非目标话音的抗干扰能力,从而提升语音转录质量。
技术领域
本申请涉及语音信号处理技术领域,具体涉及语音转录设备、系统和方法,以及电子设备。
背景技术
语音转录技术是近年来语音信号处理领域的一大研究热点。随着研究的不断深入,目前该项技术已经在庭审现场和多人会议等场合中得到了广泛的应用。
图1示出了一种常见的语音转录现场示意图。该方案在每个人面前配置一个鹅颈麦克设备,通过鹅颈麦克设备采集每个人的音频,将采集到的音频传送至音频处理装置,由音频处理装置对采集到的原始音频进行扩音处理,再将扩音后的音频发送至转录云服务,通过转录云服务进行对扩音后的音频进行语音转录处理。
然而,在实现本发明过程中,发明人发现该技术方案至少存在如下问题:
1)由于鹅颈麦克风本身的限制,其有效的拾音区域非常小,当用户偏离其有效区域或者距离过远的时候,用户的声音会被抑制,导致声音忽大忽小,影响转录效果;
2)由于鹅颈麦克风对声音的抑制效果又是有限的,周围人的声音也很容易被采集进去,因此在多人会议的时候或者庭审现场有噪声和回放等干扰条件下,抗干扰能力差,导致转录出现串音。综上所述,现有技术存在拾不到目标话音且外部串音干扰的问题。
发明内容
本申请提供语音转录设备,以解决现有技术存在的拾不到目标话音且外部串音干扰的问题。本申请另外提供语音转录系统和方法,以及电子设备。
本申请提供一种语音转录设备,包括:
语音采集装置,用于通过传声器阵列采集阵列接收范围内的语音信号;
声源定位装置,用于若所述语音信号包括话音信号,则确定所述话音信号的声源位置;
目标话音过滤装置,用于若所述声源位置在目标范围内,则将所述话音信号作为目标话音信号;
信号发送装置,用于将所述目标话音信号向外发送,以使得语音转录服务器对所述目标话音信号进行语音转录。
可选的,还包括:
语音降噪装置,用于根据所述声源位置,对所述目标话音信号进行语音增强;
所述信号发送装置,具体用于将增强后的目标话音信号向外发送。
可选的,还包括:
噪声协方差确定装置,用于若所述语音信号包括噪音信号,则确定所述语音信号的噪声协方差;
所述语音降噪装置,还用于根据所述噪声协方差,对所述噪音信号进行抑制。
可选的,还包括:
目标范围配置装置,用于获取所述目标范围,存储所述目标范围。
可选的,还包括:
所述目标话音过滤装置,还用于若所述声源位置不在所述目标范围内,则屏蔽所述话音信号。
可选的,所述传声器阵列的排布方式包括:方形阵列或圆形阵列。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811004661.6/2.html,转载请声明来源钻瓜专利网。