[发明专利]一种游戏角色中文语音自动识别方法在审
申请号: | 201810671470.9 | 申请日: | 2018-06-26 |
公开(公告)号: | CN108962251A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 杨键;陈镇秋;陈汉辉;李茂;吴海权;卢歆翮;江卓浩;陈晨 | 申请(专利权)人: | 珠海金山网络游戏科技有限公司;广州西山居世游网络科技有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G06T13/20 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 俞梁清 |
地址: | 519000 广东省珠海市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口型动画 频谱数据 游戏角色 元音发音 中文语音 自动识别 平滑滤波处理 共振峰数据 设计过程 视觉特征 语音交互 游戏 高效率 共振峰 元音 微调 匹配 语音 反馈 情景 重复 制作 对话 应用 表现 | ||
本发明的技术方案包括一种游戏角色中文语音自动识别方法,用于实现:对配音提取频谱数据,将频谱数据进行平滑滤波处理,利用处理后的数据算出共振峰数据,根据元音发音在共振峰上的特点提取元音发音并匹配对应元音动作,应用在游戏中,根据实际表现保持或微调语音口型动画。本发明的有益效果为:简化了游戏口型动画设计过程中重复的建立及修改过程,实现了高效率的情景对话动画的制作,并且以及实时的口型动画反馈和调整,达到良好的语音交互效果和视觉特征。
技术领域
本发明涉及一种游戏角色中文语音自动识别方法,属于计算机游戏领域。
背景技术
随着互联网愈发发达,人们的娱乐休闲方式也越来越多样,而游戏行业在网络领域也是大行其道,现在大部分的游戏,都配有剧情对话动画,以增加玩家的代入感和沉浸感,目前制作剧情对话动画主要有两种方法,一是直接使用三维动画根据语音制作动画,二是基于音量改变口型大小。
参考图1及图2的现有技术的处理流程图。
图1所示的基本流程是:先由人工处理语音,使用三维动画软件根据语音调整制作整句的语音动画,然后观察是否满足游戏效果表现的需求,如不满足,则继续根据语音调整制作整句的语音动画,直到满足效果为止,最后输出每一句语音动画。
图2所示的基本流程是:获取游戏配音的音量大小,使用简单的代码参数来根据游戏语音声音大小控制人物嘴型的张合。
上述方法均有不同的缺陷,图1所示方法存在以下缺陷:
1、游戏中会存在大量的语音对话需求,根据具体需求每句话都要至少一个动画制作,如果每句语音都需要让美术通过人工制作的方式来制作语音动画,将会大量占用了3D动作美术的时间,这大量的工作量往往导致游戏工作室抛弃了这个细节层次优化的方案,从而降低游戏品质。
2由于没有自动化生成,制作的过程中,需要反复听每句语音,游戏制作中,语音量往往特别庞大,这种制作流程变得冗余而耗时。
图2所示方法存在以下缺陷:该方案采用比较常用的基于音量控制嘴型张合,即基于音量响度等方式初略的判断当时角色的口型张合。这种方式在要求精品化的游戏中不适用,因为仅仅的音量响度张合,使得角色缺乏真实感。
发明内容
为解决上述问题,本发明的目的在于提供一种游戏角色中文语音自动识别方法,以达到自动化处理游戏角色语音口型表现,并且达到精品化游戏要求。
本发明解决其问题所采用的技术方案是:
一种游戏角色中文语音自动识别方法,所述方法包括以下步骤:
提取频谱数据的步骤,识别音频文件,读取音频文件并提取频谱数据;处理频谱数据的步骤,对频谱数据进行平滑滤波处理;获取共振峰数据的步骤,经过平滑滤波处理后的频谱数据,得到共振峰数据;生成口型动画数据的步骤,将得到的共振峰数据生成为口型动画数据。
进一步,所述提取频谱数据的步骤包括:获取配音音频文件识别配音音频文件是否为中文配音音频文件,若是则基于音频文件提取出频谱数据,若不是则不执行处理。
进一步,所述处理频谱数据的步骤包括:将频谱数据输入数组的值与高斯内核执行卷积操作,得到卷积结果并将卷积结果当做输出值,执行所述获取共振峰数据的步骤。
进一步,所述将频谱数据输入数组的值与高斯内核卷积的步骤包括:高斯模板生成及卷积处理。
进一步,所述高斯模板生成包括:创建高斯模板定义高斯模板的尺寸,以及σ;根据模板的尺寸,找到模板的中心位置;执行遍历处理,根据高斯分布的函数,计算模板中每个系数的值。
进一步,所述卷积处理的步骤包括:将得到的高斯模板作为权重与频谱数据执行乘算处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山网络游戏科技有限公司;广州西山居世游网络科技有限公司,未经珠海金山网络游戏科技有限公司;广州西山居世游网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810671470.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别方法、装置及电子设备
- 下一篇:数据处理方法、装置以及医用终端