[发明专利]一种通过语音或文字自动生成虚拟人物的口型的方法在审
申请号: | 202010763083.5 | 申请日: | 2020-07-31 |
公开(公告)号: | CN112420048A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 石亚东 | 申请(专利权)人: | 石亚东 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/25;G10L15/06;G10L15/02;G10L13/04;G10L13/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 405200*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 语音 文字 自动 生成 虚拟 人物 口型 方法 | ||
1.一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:包括
一语音数据库的设立,语音数据库采用的音频来源主要是两种:一种是由人直接录制的干净人声,还有一种是利用现在市面上有的各大语言合成技术;
一语音识别技术单元,用于对外来的语音进行分析识别;
一口型动作单元,包括用于对汉语口型动作的收录形成一个对照收录库单元以及人体表情捕捉单元,根据人体表情捕捉单元捕捉人体表情,对比对照收录库单元内的口型以通过人体模型展示;
一获取语音数据单元,获取语音数据具有语音生成单元,语音生成单元由用户说话时,用户的语音传入录音设备,从而实时生成当时语音输入处理单元;语音输入处理单元经过语音识别技术单元将语音转换为文字输入语句分析单元;
其中语音输入处理单元还进行语音分割点处理的语音分割处理单元,分割处理单元用于对先把音频分割成若干份或不进行切割以标记形式标记对应声音片段时间位置,音频分割的分割点是以声音振幅连续一段时间局部最小的位置;
利用语音识别技术单元把经过切割后的每段声音的内容依次识别出来,得到每段的内容还有字数长度,也可以得到这段语音的时间长度,因为我们知道这段语音的内容,结合口型动作单元的对照收录库单元,可得出当时实时的口型,根据识别的字数长度以确定每个口型动画播放的时间长度。
2.根据权利要求1所述的一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:分割点是以声音振幅连续一段时间局部最小的位置采取方法是指:人讲话会停顿,对于安静的环境录音干净人声,人是会换气的,换气就会停顿,停顿的地方就没有声音,或者声音振幅相比其它地方都比较低,这些地方就是我们切割音频的地点,语言合成的声音也有停顿。
3.根据权利要求2所述的一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:语音识别技术单元包括有语音识别算法单元,其对通过分割点得到若干切割好的声音片段,逐个分析得到该段的汉字内容以及每个汉字出现的时间,结合对照收录库单元,得到这段汉字的口型动画,最后按照切割的声音片段依次播放就可。
4.根据权利要求1或2或3所述的一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:对照收录库单元采集有十六种口型,十六种口型分为十五种口型动作和一个默认静止动作。
5.根据权利要求1所述的一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:还包括文字直接输入单元。
6.根据权利要求1所述的一种通过语音或文字自动生成虚拟人物的口型的方法,其特征在于:语音识别技术单元是开源的语音识别技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石亚东,未经石亚东许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763083.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:机器人系统
- 下一篇:监视控制系统、监视控制系统的构筑方法