[发明专利]语音识别方法、系统、介质、计算机设备、终端及应用有效
申请号: | 202011533459.X | 申请日: | 2020-12-23 |
公开(公告)号: | CN112712804B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 胡鑫;涂志莹;李春山;李政佐;赵云龙;初佃辉 | 申请(专利权)人: | 哈尔滨工业大学(威海) |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/14;G10L15/16;G10L15/06;G10L15/18;G10L15/30;H04L67/02;H04L67/133 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 盛君梅 |
地址: | 264209 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 系统 介质 计算机 设备 终端 应用 | ||
本发明属于语音信息处理技术领域,公开了一种语音识别方法、系统、介质、计算机设备、终端及应用,通过基于医疗领域文本数据上进行语言模型建模对医疗领域语音识别;对识别文本进行后处理得到阅读的形式,包括标点预测与文本逆标准化两种后处理任务;标点预测识别文本添加表征句子边界信息的标点符号,文本逆标准化将识别文本中朗读形式的符号发音文本转写为阅读形式的符号形式。本发明根据医疗领域语音识别系统的需求进行分析与设计,开发了基于web的网站系统。通用录入与模板录入两种功能形式符合语音识别实际的录入形式需求。本发明的语音识别与后处理技术作为系统支撑下,完成了性能出色,并具有用户友好性的软件系统。
技术领域
本发明属于语音信息处理技术领域,尤其涉及一种语音识别方法、系统、介质、计算机设备、终端及应用。
背景技术
目前:语音识别技术从对特定说话人孤立数字识别系统开始已有六十多年的发展,技术方案从初期的模式匹配方法,逐步发展为如今的基于统计的模型。上世纪九十年代中期到本世纪初,基于高斯混合模型(Gaussian Mixture Model,GMM)和隐马尔科夫模型(Hidden Markov Model,HMM)的混合语音识别框架的发展使得大规模连续语音识别系统的开发成为可能。进入本世纪以来,随着深度学习的蓬勃发展,基于深度学习的语音识别技术成为主流。2015年之前,基于深度学习的语音识别仍属于混合框架语音识别框架。上下文相关-深度神经网络-隐马尔科夫框架(Context-Dependent Deep Neural Network HiddenMarkov Model,CD-DNN-HMM),以及循环神经网络-隐马尔科夫框架(Recurrent NeuralNetworkHidden Markov Model,RNN-HMM)中,深度学习模型逐步替代了GMM作为发音状态概率分布进行建模,极大地提高了语音识别的效果。然而,基于混合架构的语音识别框架构建过程复杂,且需要大量的专家知识,自2015年以来,研究人员开始研究不依赖HMM的更简单的语音识别框架,即端到端的语音识别框架。基于链接的时序分类器(ConnectionistTemporal Classification,CTC)与基于带注意力机制的RNN编解码结构等端到端技术的不断提出,端到端的语音识别系统越来越成为学术界研究的热点。目前工业界应用上,基于混合架构的语音识别框架与端到端的语音识别框架仍处于共存的状态,应用于不同特点的应用场景与产品。
语音识别模块输出的识别文本通常是没有标点符号的,为识别文本添加标点符号能够大大地提高文本的可读性,并能够增强机器翻译、问答、情感分析等下游任务的性能。目前,标点预测等句子边界信息检测的研究已经得到了广泛的研究,可以分为基于声学特征的方法、基于文本特征的方法与基于声学特征与文本特征的混合方法三种。尽管基于声学特征的在很多情况下都是有效的,但是当用户在真实的ASR系统中不自然的地方停顿时,它并不能很好地发挥作用。基于声学和文本特征的混合方法可以缓解这个问题,但是,这些方法需要将文本数据与相应的声学数据一起用于训练,而由于声学与文本数据的平行数据的采集难度较大,基于声学特征和文本特征的混合方法在数据上具有局限性。
基于文本特征的方法有在包含标点的文本上训练N-gram语言模型(语言模型是语音识别的重要部分)对标点符号进行预测,近年来的研究一般将标点预测任务视为序列标注任务,或者无标点文本到有标点文本的单语言机器翻译任务。带注意力机制的循环神经网络,带条件随机场的双向长短时记忆网络(BiLSTM-CRF)等模型以序列标注任务的形式提高了标点预测的性能。带注意力机制的循环神经网络编码解码模型则被用于以机器翻译的形式解决标点符号的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海),未经哈尔滨工业大学(威海)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011533459.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:结构光测量传感器的标定方法和装置
- 下一篇:ABS线束组装设备