[发明专利]庭审语音实时转写方法、装置、计算机设备及存储介质有效
申请号: | 201810952276.8 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109192213B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 黄锦伦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/00;G10L17/04;G10L17/14;G10L21/0208;G10L21/0216;G10L25/24 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 周燕君 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 庭审 语音 实时 转写 方法 装置 计算机 设备 存储 介质 | ||
本发明公开一种庭审语音实时转写方法、装置、计算机设备极存储介质,该方法包括通过麦克风阵列采集原始语音数据;对原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对目标语音数据进行声纹特征提取,获取目标声纹特征;基于麦克风阵列标识查询数据库,获取与麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;基于目标声纹特征与每一标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;采用预先训练的语音识别模型对目标声纹特征进行识别,获取与目标声纹特征对应的目标文字数据;在显示设备实时显示目标文字数据和目标身份数据,解决人工转写过程中效率低下的问题。
技术领域
本发明涉及数据处理领域,尤其涉及一种庭审语音实时转写方法、装置、计算机设备及存储介质。
背景技术
目前法庭庭审中,通常由书记员事先确认每一当事人的身份信息之后,再对每一当事人陈述的意见或内容进行记录。这种由书记员人工对法庭庭审内容进行整理和记录的方式,可能对当事人陈述的意见或内容造成一定的误差,且通过人工记录速度较慢,影响庭审进程,导致实时转写效率低下。
发明内容
本发明实施例提供一种庭审语音实时转写方法、装置、计算机设备及存储介质,以解决人工转写庭审记录过程中效率低下的问题。
一种庭审语音实时转写方法,包括:
通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;
对所述原始语音数据进行数据预处理,获取目标语音数据;
采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;
基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;
基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;
采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;
在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。
一种庭审语音实时转写装置,包括:
采集模块,用于通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;
预处理模块,用于对所述原始语音数据进行数据预处理,获取目标语音数据;
声纹特征提取模块,用于采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;
数据查找模块,用于基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;
身份数据获取模块,用于基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;
文字数据获取模块,用于采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;
显示模块,用于在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述庭审语音实时转写方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述庭审语音实时转写方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810952276.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制方法及装置
- 下一篇:一种语音取号方法、存储介质和机器人