[发明专利]语音识别后处理方法和系统及相关设备在审
申请号: | 202011476615.3 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112634878A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 黄石磊;刘轶;程刚 | 申请(专利权)人: | 深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究院 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183;G10L15/19;G10L15/22 |
代理公司: | 深圳市万商天勤知识产权事务所(普通合伙) 44279 | 代理人: | 罗建平 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 处理 方法 系统 相关 设备 | ||
本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
技术领域
本发明涉及语音识别技术领域,具体涉及一种语音识别后处理方法和系统及相关设备。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。一个语音识别系统主要由声学模型、语言模型、发音词典构成。其中语言模型目前大致可分成三类:基于规则的语言模型,基于统计的语言模型,基于神经网络的语言模型。而目前基于统计的N-gram语言模型被普遍应用在语音识别中,它假设任意一个词出现的概率最多只同它前面N-1个词有关。所以,N-gram语言模型可以利用的上文信息受到N大小的限制。理论上N越大,它可以利用更多的上文信息。但是N越大,该模型的数据稀疏问题就越严重。为了解决数据稀疏问题,许多相关的平滑算法也相继被提出:拉普拉斯平滑、内插法、回溯法。如今,基于神经网络的语言模型得到广泛的关注。在此基础上,人们提出了双向语言模型,基于注意力机制的语言模型等等。如何将基于神经网络的语言模型应用到语音识别系统中来进一步提升系统的性能,是目前重要的研究方向。
发明内容
本发明的目的在于提供一种语音识别后处理方法和系统及相关设备,以提升语音识别系统的性能。
为实现上述发明目的,本发明采用如下技术方案。
本发明第一方面,提供一种语音识别后处理方法,包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N-best lists;使用训练好的带有词性的BERT(Bidirectional Encoder Representation fromTransformers,基于Transformer的双向编码器表征)双向语言模型对N-best lists进行重打分;从N-best lists中选择得分最高的结果作为最终的识别结果。
一种可能的实现方式中,所述方法还包括预先训练带有词性的BERT双向语言模型的训练步骤,该训练步骤具体包括:对训练用的文本语料进行预处理;通过分词工具进行分词和词性标注,获取文本语料中的词组和对应的词性,然后利用B、I、E、S四个标签与词性进行组合,对各词组的词性进行进一步分配;将文本语料的文本信息和词性信息进行相同的掩膜处理;对掩膜处理后的文本信息的词向量和词性信息的词向量进行平均加权求和,然后输入到网络中训练得到带有词性的BERT双向语言模型;其中,在训练BERT双向语言模型过程中,禁用预测下一句NSP任务,仅保留通过掩膜方式训练语言模型的Mask LM任务。
一种可能的实现方式中,所述使用训练好的带有词性的BERT双向语言模型对N-best lists进行重打分,包括:对N-best lists中的每个结果所组成的句子,通过分词工具求出句子中每个词的词性,然后利用B、I、E、S四个标签与词性进行组合来进一步划分出每个字的词性;采用基于滑动窗口的输入样本方式和逐字掩膜的编码方式,对每个句子构造输入样本并进行编码处理,然后输入到BERT双向语言模型;经由BERT双向语言模型计算得出每个句子的概率和得分,完成对N-best lists的重打分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究院,未经深港产学研基地(北京大学香港科技大学深圳研修院);北京大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011476615.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通讯电路和空调器
- 下一篇:动物双歧杆菌在提高肿瘤免疫治疗应答中的作用