[发明专利]基于人工智能的字母音素转换模型生成方法及装置有效
申请号: | 201610102345.7 | 申请日: | 2016-02-24 |
公开(公告)号: | CN105590623B | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 陈志杰;康永国 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/187;G10L25/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 字母 音素 转换 模型 生成 方法 装置 | ||
本申请提出一种基于人工智能的字母音素转换模型生成方法及装置,其中,该方法包括:在应用神经网络对训练数据中的每个单词进行字母音素转换的每次训练过程中,按照预设的节点比例对所述神经网络的隐层节点进行随机筛选,获取用于训练每个单词的保留节点;应用与所述保留节点对应的子神经网络训练对应的单词,更新所述子神经网络各保留节点的相关权重;最终对所有子神经网络各保留节点的相关权重进行均值处理,生成字母音素转换模型。通过本申请提供的基于人工智能的字母音素转换模型生成方法和装置,提高了字母音素转换模型的学习能力和泛化能力,从而避免了过拟合现象。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的字母音素转换模型生成方法及装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能最重要的方面就是语音识别技术。
字母到音素的转换模型(grapheme-to-phoneme,g2p)是英文语音合成中十分重要的处理模块,用于对接收到的单词中的字母转换成对应音素。现有技术中,通过深度神经网络技术来训练g2p模型,能够得到比基于统计语言模型更好的应用效果。
由于g2p模型的目标是将单词转换成对应的音素序列,而实际存在的单词数量也是相对固定的,也就是10万个单词左右。但是,g2p训练模型所需的数据量是相对固定的。通过深度神经网络来训练g2p模型的过程完全不同于声学模型的训练,具体如下:
通过神经网络训练声学模型时,由于可以不断地增加训练数据,因此神经网络的层数以及每一层的单元数可以不断增大,以此带来更好的性能。但对于g2p模型的训练来讲,如果增大网络层数以及每一层的单元数,但训练数据量还是相对不变的话,很容易造成过拟合现象的发生。所谓过拟合现象就是指,训练出来的g2p模型在训练数据上表现很好,但在测试数据上却表现得不如训练数据那样好。
然而,如果选择一个较小的网络来训练g2p模型,可以得到一个性能相对可以接受的g2p模型,但这样的网络的层数以及每一层的单元数都会相对较小,不如深层神经网络那样拥有更强的学习能力和泛化能力。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于人工智能的字母音素转换模型生成方法,该方法应用节点动态隐藏的深度神经网络训练数据,生成字母音素转换模型,提高了字母音素转换模型的学习能力和泛化能力,避免了过拟合现象。
本申请的第二个目的在于提出一种基于人工智能的字母音素转换模型生成装置。
为达上述目的,本申请第一方面实施例提出了一种基于人工智能的字母音素转换模型生成方法,包括:在应用神经网络对训练数据中的每个单词进行字母音素转换训练的过程中,按照预设的节点比例对所述神经网络的隐层节点进行随机筛选,获取用于训练每个单词的保留节点;应用与所述保留节点对应的子神经网络训练对应的单词,更新所述子神经网络各保留节点的相关权重;对所有子神经网络各保留节点的相关权重进行均值处理,生成字母音素转换模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610102345.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理的方法及装置
- 下一篇:液晶面板驱动系统中的切角电路