[发明专利]一种基于通信调度指令的语音识别的智能系统及方法在审
申请号: | 202210829783.9 | 申请日: | 2022-07-15 |
公开(公告)号: | CN115312038A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 胥泽龙;秦瑾;蒋永录;赵玮 | 申请(专利权)人: | 中电万维信息技术有限责任公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/16;G10L15/14;G10L15/20;G10L25/03 |
代理公司: | 兰州嘉诺知识产权代理事务所(普通合伙) 62202 | 代理人: | 郭海 |
地址: | 730000 甘肃省兰州市城关*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通信 调度 指令 语音 识别 智能 系统 方法 | ||
本发明属于计算机领域中的语音识别技术,特别是一种基于通信调度指令的语音识别的智能系统及方法。本发明调度指令数据进行全生命周期管理。利用深度残差收缩网络DRSN‑CS对语音数据进行降噪或者冗余信息处理。在模型训练过程中使用开源词典结合自定义专业词典提升准确率。
技术领域
本发明属于计算机领域中的语音识别技术,特别是一种基于通信调度指令的语音识别的智能系统及方法。
背景技术
通信智能调度工作具有专业性强、操作复杂、准确率要求高的特点。目前调度工作主要为操作人员对参与通信调度的下发指令的人员进行人为的身份判别后,操作人员按照指令进行操作。现有的通信智能调度工作过程主要是使用调度电话系统,通过指令员和操作员完成下令、记录、复诵、确认、操作、回令整个流程。该过程中指令内容为人工核对,在效率、准确率、安全性方面有待提高。
本发明在通信智能调度系统中通过声纹识别、语音识别,对调度人员语音信号的远程采集和处理,解析声纹信息确认调度员、操作员,将调度语音指令转化为文字进行存储。本发明对调度指令进行识别有效提高了语音识别的准确率和工作效率,并消除了人工操作误差,能够较好地满足通信智能调度过程中的语音识别的需要。
发明内容
本发明解决现有技术不足提供一种基于通信调度指令的语音识别的智能系统及方法,其特征在于包括如下步骤:
S01语音训练语料
训练语料由开源语音语料库、通信调度指令语音语料库两部分组成;
开源语音语料库;通信调度语料库收集的通信调度工作人员日常调度指令的语音数据,该语音数据包含通信行业专业术语名词,或者包含地方特征的语音数据,该语料来源于通讯调度命令日常用语,对比开源预料对专业名称的包含内容更加丰富;
S02特征提取
步骤S021:增加语音信号相较于低频分量的高频分量幅度,语音能量主要集中在低频,提高高频,有助于提高信噪比,去除声门激励、口鼻辐射、传播时高频衰减更大的影响,设n时刻的语音采样值为x(n),经过预加重处理后的结果y(n)为:
y(n)=x(n)-0.96*x(n-1)
步骤S022:对音频进行分帧,把声音切分成很多小的片段,帧与帧之间有一定的交叠,每一帧长度是25ms,帧移是10ms,两帧之间有25-10=15ms的交叠;
步骤S023:在分帧之后,通常需要对每帧的信号进行加窗处理,其窗函数为:
这里0≤n≤N-1,N是窗的宽度;
步骤S024:对于每一帧的加窗信号,进行N点FFT变换,也称短时傅里叶变换(STFT),N通常取256或512。
步骤S025:经过上面的步骤之后,在能量谱上应用Mel滤波器组,就能提取到FBank特征;
步骤S026:去均值减少训练集与测试集之间的不匹配,均衡频谱,提升信噪比;
S03声学模型训练
1)构建模型
构建声学模型,该模型包括:深度神经网络、隐马尔可夫模型;在该框架中,HMM用来描述语音信号的动态变化,用DNN的每个输出节点来估计连续密度HMM的某个状态的后验概率。该模型的整体输入是fbank特征,而后DNN对所有聚类后的状态的似然度进行建模,得到后验概率。再结合HMM对其进行解码;
2)训练模型
DNN-HMM模型的主要训练步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电万维信息技术有限责任公司,未经中电万维信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210829783.9/2.html,转载请声明来源钻瓜专利网。