[发明专利]一种基于神经网络的语音数据的识别方法与设备在审
申请号: | 202010408288.1 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111681669A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 周康明;陈猛 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/18;G10L25/45;G10L15/02;G10L15/06;G10L19/02 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 语音 数据 识别 方法 设备 | ||
本申请通过一种基于神经网络的语音数据的识别方法,首先获取待识别语音数据,接着确定所述待识别语音数据对应的语谱图,然后将所述语谱图输入已完成训练的声学神经网络模型,获得所述待识别语音数据对应的拼音数据,再接着对所述拼音数据进行编码,获得编码拼音数据,最后将所述编码拼音数据输入已完成训练的语言神经网络模型,基于预置字典,获得待识别语音数据对应的汉字数据。通过该方法基于神经网络实现对语音数据的自动识别,获得所述语音数据对应的汉字数据,提升了对语音数据自动识别准确率,带来有益的实用效果。
技术领域
本申请涉及计算机语音数据处理技术领域,尤其涉及一种基于神经网络的语音数据的的技术。
背景技术
提供窗口服务的企事业单位针对其窗口人员向客户提供的语音服务等往往都制定了礼貌用语规范,以塑造和体现其单位形象。
但在日常情况下,对窗口人员向客户提供的语音服务是否符合礼貌用语规范往往是事后通过人工查看录音录像来检查监督,效率低,无法对窗口人员向客户提供的语音服务进行准确识别。
发明内容
本申请的目的是提供一种基于神经网络的语音数据的识别方法与设备,用以解决现有技术中有关窗口人员提供的语音服务识别效率低的技术问题。
根据本申请的一个方面,提供了一种基于神经网络的语音数据的识别方法,其中,所述方法包括:
获取待识别语音数据;
确定所述待识别语音数据对应的语谱图;
将所述语谱图输入已完成训练的声学神经网络模型,获得所述待识别语音数据对应的拼音数据;
对所述拼音数据进行编码,获得编码拼音数据;
将所述编码拼音数据输入已完成训练的语言神经网络模型,基于预置字典,获得待识别语音数据对应的汉字数据。
可选地,在所述确定所述待识别语音数据对应的语谱图之前,对所述待识别服务语音数据做预处理,其中,所述预处理包括:
对所述待识别服务语音数据进行过滤和截取;
将过滤和截取后的所述待识别服务语音数据做分帧和加窗操作。
可选地,其中,所述已完成训练的声学神经网络模型是对改进残差网络结合CTC时序分类的神经网络模型进行训练后获得的。
可选地,其中,所述改进残差网络的结构是将残差网络中的恒等映射改进为多组卷积层。
可选地,其中,所述已完成训练的声学神经网络模型的训练包括:
获取服务语音数据;
基于所述服务语音数据获得服务语音数据集;
对所述服务语音数据集中的每条语音数据标注标签,获得第一训练集和第一测试集,其中,所述标签为服务语音数据对应的拼音;
对所述第一训练集和第一测试集中的服务语音数据作分帧和加窗操作,获得对应的语谱图训练集和语谱图测试集;
将所述语谱图训练集和语谱图测试集输入改进残差网络结合CTC时序分类的神经网络模型,经过预设迭代次数的迭代训练,根据困惑度的大小,确定所述已完成训练的声学神经网络模型。
可选地,其中,所述已完成训练的语言神经网络模型是对BiLSTM网络结合softmax回归的神经网络模型进行训练后获得的。
可选地,其中,所述已完成训练的语言神经网络模型的训练包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010408288.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置