[发明专利]基于动态时间规划根据语音信息合成舌超声视频的方法有效
申请号: | 201910696959.6 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110428812B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 燕昭;吕绪康;路文焕;何宇清 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/08;G10L15/26;G10L19/02;G10L21/10;G10L25/15;G10L25/24;G10L25/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音与图像合成技术领域,为获得连贯自然且较为清晰的舌超声运动图像。为此,本发明采取的技术方案是,基于动态时间规划根据语音信息合成舌超声视频的方法,首先基于语音识别技术识别输入的语音文字,之后根据共振峰能量根据识别结果按独立发音切割语音段,通过动态时间规划的方法,将输入语音中每个字的舌运动图像自语音‑超声图像库中选择出来,在单词拼接过程中使用全连接神经网络自编码器提取特征值进行插值,最终合成出连贯的舌超声图像。本发明主要应用于超声视频图像处理场合。 | ||
搜索关键词: | 基于 动态 时间 规划 根据 语音 信息 合成 超声 视频 方法 | ||
【主权项】:
1.一种基于动态时间规划根据语音信息合成舌超声视频的方法,其特征是,首先基于语音识别技术识别输入的语音文字,之后根据共振峰能量根据识别结果按独立发音切割语音段,通过动态时间规划的方法,将输入语音中每个字的舌运动图像自语音‑超声图像库中选择出来,在单词拼接过程中使用全连接神经网络自编码器提取特征值进行插值,最终合成出连贯的舌超声图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910696959.6/,转载请声明来源钻瓜专利网。