[发明专利]拼音作为特征的中文语音识别后的文本神经网络纠错模型在审

申请号：	201910968667.3	申请日：	2019-10-12
公开（公告）号：	CN110765772A	公开（公告）日：	2020-02-07
发明（设计）人：	段大高;张露元;梁少虎;丛扬潇;罗志颖;韩忠明	申请（专利权）人：	北京工商大学
主分类号：	G06F40/289	分类号：	G06F40/289;G06N3/04;G06N3/08
代理公司：	11335 北京汇信合知识产权代理有限公司	代理人：	张焕响
地址：	100037***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	拼音编码中文语音构建纠错拼音卷积编码器神经网络文本编码器解码器神经网络输入解码器模型平行语料库准确度解码过程局部信息局部序列模型输入拼音特征位置编码词向量训练集卷积出错句子嵌入中文转化网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.拼音作为特征的中文语音识别后的文本神经网络纠错模型，其特征在于，包括如下步骤：

步骤一、收集中文语音，构建中文语音识别文本纠错平行语料库，将收集的中文语音转化为文本，然后对文本进行纠错，将每条原文本和经过纠错后得到的相应文本组成句子对，将得到的句子对构成训练数据集；

步骤二、将训练数据集中的句子对转化为拼音，通过词嵌入方法将其编码为拼音向量；

步骤三、构建包括词向量编码、位置编码和拼音编码三部分的神经网络输入特征；

步骤四、构建深度卷积的编码器解码器神经网络，使用编码器对步骤三得到的神经网络输入特征进行编码，使用解码器对当前待解码文本中的待解码词序列使用乘性注意力机制解码得到相应的预测词和当前待解码词的概率，提前设定阈值，若此概率大于预设定的阈值，则使用预测词，否则，使用原输入序列中对应的词代替，得到最终纠错后的中文语音文本。

2.根据权利要求1所述的拼音作为特征的中文语音识别后的文本神经网络纠错模型，其特征在于：步骤一具体为：收集中文语音，然后通过开源语音识别工具ASRT把语音转化为文本，通过人工干预纠错方法对转化后得到的每条文本逐条进行纠错，得到经过纠错后的文本，并将经过纠错后的文本作为神经网络的训练标签，每条原文本和经过人工干预纠错后得到的文本组成句子对，构成训练集。

3.根据权利要求1所述的拼音作为特征的中文语音识别后的文本神经网络纠错模型，其特征在于：步骤二具体为：使用pypinyin工具包将训练数据集中的句子对转化为拼音，然后通过one-hot对拼音编码进行编码，将其向量化后作为拼音向量。

4.根据权利要求1所述的拼音作为特征的中文语音识别后的文本神经网络纠错模型，其特征在于：步骤三具体为：本模型的输入特征包括1)词向量编码，2)位置编码,3)拼音编码；词向量编码的过程为：在大规模中文对话数据集上通过word2vec开源工具训练得到词向量，词向量作为网络初始化的词向量编码随着网络训练而更新；位置编码是指词在一句话中的绝对位置；网络最终的输入特征是词向量编码、拼音编码和位置编码三者经过拼接后得到的向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工商大学，未经北京工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910968667.3/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]拼音作为特征的中文语音识别后的文本神经网络纠错模型在审

专利文献下载