[发明专利]一种双视位口型合成方法在审
申请号: | 201910238403.2 | 申请日: | 2019-03-27 |
公开(公告)号: | CN109830236A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 陈华谋;朱海飞;李培宏;许崇铭;陈宏楷 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;H04N5/232;H04N5/76;G10L15/08;G06F16/33;G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 口型 视位 文本材料 归类 合成 视频 语音识别技术 声韵母识别 发音口型 合成技术 平滑处理 逼真度 声韵母 时间点 复现 发音 录制 查找 汉语 语音 | ||
1.一种双视位口型合成方法,其特征在于,包括:
将汉语普通话中的发音进行视位归类,共分为13类;
根据视位归类录制相应口型视频;
根据原始的口型视频建立基本口型视位库;
对基本口型视位库进行双视位处理,从而获得基本口型双视位库;
利用语音识别技术对新输入的语音进行识别,得到文本材料,对文本材料经过声韵母识别后,在基本口型双视位库中查找每一个声韵母所对应的口型视位,并将所述口型视位插入到对应的时间点当中,形成一段离散的口型序列,并将该离散的口型序列经过平滑处理得到连续的口型序列。
2.根据权利要求1所述的双视位口型合成方法,其特征在于,将汉语普通话中的发音进行视位归类,共分为13类,具体包括:
将汉语普通话中的21个声母和6个单韵母根据口型视位的相似度进行分类,对于复韵母和鼻韵母,根据发音时的口型视位,拆分成21个声母和6个单韵母的组合,从而完成对汉语普通话中所有声母和韵母的归类,归类情况如下:
第一类:[a];第二类:[b\p\m];第三类:[d\t\n\l];第四类:[e];第五类:[f];第六类:[g\k\h];第七类:[i];第八类:[j\q\x];第九类:[o];第十类:[u];第十一类:[ü];第十二类:[z\c\s];第十三类:[zh\ch\sh\r]。
3.根据权利要求1所述的双视位口型合成方法,其特征在于,根据视位归类录制相应口型视频具体包括:
使用摄像支架固定相机,调整摄像头正对着人脸,录制时,只允许人脸中的嘴唇和下巴运动,采用录像的方式录制13种发音口型对应的口型视频。
4.根据权利要求1所述的双视位口型合成方法,其特征在于,根据视位归类录制相应口型视频,还包括将录制的口型视频进行矫正和消抖处理;
所述矫正和消抖处理包括:
利用开源的人脸对齐技术OpenFace识别嘴唇和下巴的特征点,得到每一个特征点在实际坐标系中运动的坐标;
从OpenFace识别结果中获取每一帧人脸的翻滚角度,对识别出来的嘴唇和下巴的特征点的三维坐标做矫正处理,让嘴唇的特征点基本保持在水平位置上;
对特征点进行抖动消除处理,以距离嘴唇最近的面部静止特征点作为抖动消除的基准,其它所有的嘴部特征点与该基准做差值,从而消除口型录制对象的微小抖动。
5.根据权利要求2所述的双视位口型合成方法,其特征在于,对基本口型视位库进行双视位处理,从而获得基本口型双视位库具体包括:
在第二类(b\p\m)的口型视位前增加一个闭嘴动作的口型视位作为这第二类发音前的口型视位,其他十二类的口型视位不变,得到基本口型双视位库。
6.根据权利要求1所述的双视位口型合成方法,其特征在于,利用语音识别技术对新输入的语音进行识别,得到文本材料,对文本材料经过声韵母识别后,在基本口型双视位库中查找每一个声韵母所对应的口型视位,并将所述口型视位插入到对应的时间点当中,即可形成一段离散的口型序列,并将该离散的口型序列经过平滑处理得到连续的口型序列具体包括:
对新输入的语音进行降噪处理,将利用语音识别技术识别出来的文本材料进行声韵母提取分割,并且根据口型视位的相似度将其中的复韵母和鼻韵母拆分成21个声母和6个单韵母的排列组合,在基本口型双视位库中查找每一个声韵母对应的口型视位插入到对应的时间点当中,形成一段离散的口型序列,最后通过平滑处理的方法对该段口型序列进行平滑处理合成一段连续的口型序列。
7.根据权利要求6所述的双视位口型合成方法,其特征在于,所述平滑处理的方法包括线性插值、二次插值、三次插值。
8.根据权利要求1所述的双视位口型合成方法,其特征在于,所述新输入的语音为汉语普通话。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910238403.2/1.html,转载请声明来源钻瓜专利网。