[发明专利]拼音作为特征的中文语音识别后的文本神经网络纠错模型在审

申请号：	201910968667.3	申请日：	2019-10-12
公开（公告）号：	CN110765772A	公开（公告）日：	2020-02-07
发明（设计）人：	段大高;张露元;梁少虎;丛扬潇;罗志颖;韩忠明	申请（专利权）人：	北京工商大学
主分类号：	G06F40/289	分类号：	G06F40/289;G06N3/04;G06N3/08
代理公司：	11335 北京汇信合知识产权代理有限公司	代理人：	张焕响
地址：	100037***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种拼音作为特征的中文语音识别后的文本神经网络纠错模型，包括：1)构建中文语音识别后的文本纠错平行语料库；2)构建拼音编码，将训练集的句子对转化为拼音，通过词嵌入方法编码为拼音编码；3)构建神经网络输入特征，模型输入特征包括三部分：词向量编码，位置编码和拼音编码；4)构建深度卷积的编码器解码器神经网络。由于中文语音识别后的文本错误主要是中文拼音出错，并且一般是局部错误，使用拼音编码作为网络输入的一部分，又使用深度卷积编码器解码器模型，深度卷积编码器对序列局部信息进行有效提取，在解码过程中，使用了拼音特征，又在局部序列进行纠错，从而极大提高了中文语音识别准确度。
搜索关键词：	拼音编码中文语音构建纠错拼音卷积编码器神经网络文本编码器解码器神经网络输入解码器模型平行语料库准确度解码过程局部信息局部序列模型输入拼音特征位置编码词向量训练集卷积出错句子嵌入中文转化网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.拼音作为特征的中文语音识别后的文本神经网络纠错模型，其特征在于，包括如下步骤：/n步骤一、收集中文语音，构建中文语音识别文本纠错平行语料库，将收集的中文语音转化为文本，然后对文本进行纠错，将每条原文本和经过纠错后得到的相应文本组成句子对，将得到的句子对构成训练数据集；/n步骤二、将训练数据集中的句子对转化为拼音，通过词嵌入方法将其编码为拼音向量；/n步骤三、构建包括词向量编码、位置编码和拼音编码三部分的神经网络输入特征；/n步骤四、构建深度卷积的编码器解码器神经网络，使用编码器对步骤三得到的神经网络输入特征进行编码，使用解码器对当前待解码文本中的待解码词序列使用乘性注意力机制解码得到相应的预测词和当前待解码词的概率，提前设定阈值，若此概率大于预设定的阈值，则使用预测词，否则，使用原输入序列中对应的词代替，得到最终纠错后的中文语音文本。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工商大学，未经北京工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910968667.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]拼音作为特征的中文语音识别后的文本神经网络纠错模型在审

专利文献下载