[发明专利]基于动态时间规划根据语音信息合成舌超声视频的方法有效

申请号：	201910696959.6	申请日：	2019-07-30
公开（公告）号：	CN110428812B	公开（公告）日：	2022-04-05
发明（设计）人：	燕昭;吕绪康;路文焕;何宇清	申请（专利权）人：	天津大学
主分类号：	G10L15/04	分类号：	G10L15/04;G10L15/08;G10L15/26;G10L19/02;G10L21/10;G10L25/15;G10L25/24;G10L25/30
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	刘国威
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及语音与图像合成技术领域，为获得连贯自然且较为清晰的舌超声运动图像。为此，本发明采取的技术方案是，基于动态时间规划根据语音信息合成舌超声视频的方法，首先基于语音识别技术识别输入的语音文字，之后根据共振峰能量根据识别结果按独立发音切割语音段，通过动态时间规划的方法，将输入语音中每个字的舌运动图像自语音‑超声图像库中选择出来，在单词拼接过程中使用全连接神经网络自编码器提取特征值进行插值，最终合成出连贯的舌超声图像。本发明主要应用于超声视频图像处理场合。
搜索关键词：	基于动态时间规划根据语音信息合成超声视频方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于动态时间规划根据语音信息合成舌超声视频的方法，其特征是，首先基于语音识别技术识别输入的语音文字，之后根据共振峰能量根据识别结果按独立发音切割语音段，通过动态时间规划的方法，将输入语音中每个字的舌运动图像自语音‑超声图像库中选择出来，在单词拼接过程中使用全连接神经网络自编码器提取特征值进行插值，最终合成出连贯的舌超声图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910696959.6/，转载请声明来源钻瓜专利网。

上一篇：一种数据处理方法、装置及电子设备
下一篇：一种语音理解的方法、装置、电子设备及介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于动态时间规划根据语音信息合成舌超声视频的方法有效

专利文献下载