[发明专利]用于使用循环模型执行识别和训练循环模型的方法和设备有效
申请号: | 201710810460.4 | 申请日: | 2017-09-11 |
公开(公告)号: | CN108229677B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 柳尚贤 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 张川绪;王兆赓 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 使用 循环 模型 执行 识别 训练 方法 设备 | ||
公开一种用于使用循环模型执行识别和训练循环模型的方法和设备。一种识别方法包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。
本申请要求于2016年12月14日提交到韩国知识产权局的第10-2016-0170198号韩国专利申请的权益,该韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及用于基于循环模型执行识别的技术和用于训练循环模型的技术。
背景技术
近来,为了分类人机输入模式,已经进行了关于将有效的人类的模式识别方法应用到实际计算机的积极研究。一个这样的研究领域集中在通过数学表达式对人类的生物神经细胞的特性建模的人工神经网络。为了分类输入模式,人工神经网络采用模拟人类的学习能力的算法。使用这种算法,人工神经网络产生输入模式与输出模式之间的映射。产生这样的映射的能力被称为人工神经网络的学习能力。基于学习结果,人工神经网络针对未曾用于学习的输入模式产生输出。
发明内容
提供本发明内容从而以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意在标识所要求保护的主题的关键特征或必要特征,也不意在用于帮助确定所要求保护的主题的范围。
在一个总体方面,一种识别方法包括:从序列数据提取与当前窗对应的目标数据和在目标数据之后的填充数据;获取与先前窗对应的状态参数;使用循环模型,基于状态参数、提取的目标数据和提取的填充数据,计算当前窗的识别结果。
所述识别方法还可包括:暂时存储与当前窗的最后帧对应的状态参数,以用于后续窗。
所述识别方法可还包括:排除与填充相关联的状态参数和基于循环模型计算的填充数据的输出数据。
计算识别结果的步骤可包括:以当前窗的窗长度和填充长度展开循环模型;针对每个帧将状态参数、提取的目标数据和提取的填充数据输入到展开的循环模型,并计算与包括在当前窗中的帧对应的输出数据。
计算识别结果的步骤可包括:基于与先前窗的最后帧对应的状态参数,更新与当前窗的第一帧对应的节点的输入值。
提取目标数据和填充数据的步骤可包括:从先前窗的最后帧数据之后的帧数据开始从序列数据提取与窗长度对应的数据作为与当前窗对应的目标数据。
提取目标数据和填充数据的步骤可包括:从当前窗的最后帧数据之后的帧数据开始从序列数据提取与填充长度对应的数据作为与填充对应的填充数据。
循环模型可以是被训练为响应于基于训练数据的训练输入输出训练输出的双向循环神经网络。
循环模型可包括:与包括在窗和填充中的每个帧对应的节点;计算识别结果的步骤可包括:基于所述节点的前向通路,顺序地从窗的第一帧到窗的最后帧更新状态参数;基于所述节点的反向通路,顺序地从窗的最后帧到窗的第一帧更新状态参数;将基于前向通路的状态参数和基于反向通路的状态参数提供给后续层的节点。
序列数据可对应于语音信号;计算识别结果的步骤可包括:从与当前窗对应的目标数据辨识发音。
获取与先前窗对应的状态参数的步骤可包括:响应于当前窗是相对于序列数据的第一窗,将与先前窗对应的状态参数确定为默认值。
提取目标数据和填充数据的步骤可包括:响应于当前窗是相对于序列数据的最后窗,排除填充数据。
在另一总体方面,一种非暂时性计算机可读介质存储指令,当所述指令由处理器执行时,使所述处理器执行上述识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710810460.4/2.html,转载请声明来源钻瓜专利网。