[发明专利]基于人工智能的字母音素转换模型生成方法及装置有效

专利信息
申请号: 201610102345.7 申请日: 2016-02-24
公开(公告)号: CN105590623B 公开(公告)日: 2019-07-30
发明(设计)人: 陈志杰;康永国 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G10L13/08 分类号: G10L13/08;G10L15/187;G10L25/30
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 宋合成
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 人工智能 字母 音素 转换 模型 生成 方法 装置
【说明书】:

本申请提出一种基于人工智能的字母音素转换模型生成方法及装置,其中,该方法包括:在应用神经网络对训练数据中的每个单词进行字母音素转换的每次训练过程中,按照预设的节点比例对所述神经网络的隐层节点进行随机筛选,获取用于训练每个单词的保留节点;应用与所述保留节点对应的子神经网络训练对应的单词,更新所述子神经网络各保留节点的相关权重;最终对所有子神经网络各保留节点的相关权重进行均值处理,生成字母音素转换模型。通过本申请提供的基于人工智能的字母音素转换模型生成方法和装置,提高了字母音素转换模型的学习能力和泛化能力,从而避免了过拟合现象。

技术领域

本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的字母音素转换模型生成方法及装置。

背景技术

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能最重要的方面就是语音识别技术。

字母到音素的转换模型(grapheme-to-phoneme,g2p)是英文语音合成中十分重要的处理模块,用于对接收到的单词中的字母转换成对应音素。现有技术中,通过深度神经网络技术来训练g2p模型,能够得到比基于统计语言模型更好的应用效果。

由于g2p模型的目标是将单词转换成对应的音素序列,而实际存在的单词数量也是相对固定的,也就是10万个单词左右。但是,g2p训练模型所需的数据量是相对固定的。通过深度神经网络来训练g2p模型的过程完全不同于声学模型的训练,具体如下:

通过神经网络训练声学模型时,由于可以不断地增加训练数据,因此神经网络的层数以及每一层的单元数可以不断增大,以此带来更好的性能。但对于g2p模型的训练来讲,如果增大网络层数以及每一层的单元数,但训练数据量还是相对不变的话,很容易造成过拟合现象的发生。所谓过拟合现象就是指,训练出来的g2p模型在训练数据上表现很好,但在测试数据上却表现得不如训练数据那样好。

然而,如果选择一个较小的网络来训练g2p模型,可以得到一个性能相对可以接受的g2p模型,但这样的网络的层数以及每一层的单元数都会相对较小,不如深层神经网络那样拥有更强的学习能力和泛化能力。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本申请的第一个目的在于提出一种基于人工智能的字母音素转换模型生成方法,该方法应用节点动态隐藏的深度神经网络训练数据,生成字母音素转换模型,提高了字母音素转换模型的学习能力和泛化能力,避免了过拟合现象。

本申请的第二个目的在于提出一种基于人工智能的字母音素转换模型生成装置。

为达上述目的,本申请第一方面实施例提出了一种基于人工智能的字母音素转换模型生成方法,包括:在应用神经网络对训练数据中的每个单词进行字母音素转换训练的过程中,按照预设的节点比例对所述神经网络的隐层节点进行随机筛选,获取用于训练每个单词的保留节点;应用与所述保留节点对应的子神经网络训练对应的单词,更新所述子神经网络各保留节点的相关权重;对所有子神经网络各保留节点的相关权重进行均值处理,生成字母音素转换模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610102345.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top