[发明专利]庭审语音实时转写方法、装置、计算机设备及存储介质有效
申请号: | 201810952276.8 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109192213B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 黄锦伦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/00;G10L17/04;G10L17/14;G10L21/0208;G10L21/0216;G10L25/24 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 周燕君 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 庭审 语音 实时 转写 方法 装置 计算机 设备 存储 介质 | ||
1.一种庭审语音实时转写方法,其特征在于,包括:
通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;
对所述原始语音数据进行数据预处理,获取目标语音数据;
采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;
基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;
基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;
采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;
在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。
2.如权利要求1所述的庭审语音实时转写方法,其特征在于,所述麦克风阵列包括至少三个麦克风;
所述对所述原始语音数据进行数据预处理,获取目标语音数据,包括:
采用GCC估计算法估算所述原始语音数据到达第一麦克风和第二麦克风的时延差;
基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差,采用几何定位法获取所述原始语音数据的空间坐标;
基于所述原始语音数据的空间坐标,确定所述麦克风阵列中每一麦克风对应的权重,采用加权公式对所述原始语音数据进行加权处理,获取待滤波语音数据;其中,所述加权公式为y(t)为待滤波语音数据,n为麦克风数量,i为第i个麦克风的标识,wi为第i个麦克风对应的权重,xi(t)为第i个麦克风接收到的原始语音数据;
采用维纳滤波算法对所述待滤波语音数据进行滤波处理,获取目标语音数据。
3.如权利要求2所述的庭审语音实时转写方法,其特征在于,采用GCC估计算法估算所述原始语音数据到达第一麦克风和第二麦克风的时延差,包括:
基于所述第一麦克风和所述第二麦克风,获取所述第一麦克风和所述第二麦克风的原始互相关函数;
对所述原始互相关函数做傅里叶变换,获取互功率谱;
对所述互功率谱进行加权处理,获取加权互功率谱,并对所述加权互功率谱做反傅里叶变换,获取目标互相关函数;
基于所述目标互相关函数,获取所述目标互相关函数的极大值,将所述极大值作为所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差。
4.如权利要求2所述的庭审语音实时转写方法,其特征在于,所述基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差,采用几何定位法获取所述原始语音数据的空间坐标,包括:
基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差和每一所述麦克风的空间坐标,采用定位公式获取所述原始语音数据的空间坐标;其中,所述定位公式为||s-mi||-||s-mj||=τij*v,(i=1,...,n)(j=1,...,n),s为原始语音数据的空间坐标,i和j为麦克风标识,mi为第i个麦克风的空间坐标,mj为第j个麦克风的空间坐标,τij为原始语音数据到达麦克风i和麦克风j的时延差,v为声速。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810952276.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制方法及装置
- 下一篇:一种语音取号方法、存储介质和机器人