[发明专利]基于隐马尔科夫模型的统计语音合成方法及装置有效
申请号: | 201510272044.4 | 申请日: | 2015-05-25 |
公开(公告)号: | CN105047192B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 俞凯;王向然;陈博;徐佳琛 | 申请(专利权)人: | 上海交通大学;苏州思必驰信息科技有限公司 |
主分类号: | G10L13/027 | 分类号: | G10L13/027;G06F21/36;G06F21/32 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王毓理;王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于隐马尔科夫模型的统计语音合成方法及装置,通过生成关联多模态的自然语言问题,根据自然语言问题生成相应图片并加入干扰元素,根据问题文本,使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声,本发明将验证码的模式从单模态提升到互相之间有语义关联的多模态,进一步增进现有验证码对于人类和计算机的区分性,提升互联网验证系统的人机区分度,加强安全性能。 | ||
搜索关键词: | 基于 隐马尔科夫 模型 统计 语音 合成 方法 装置 | ||
【主权项】:
1.一种基于隐马尔科夫模型的统计语音合成装置,其特征在于,包括:自然语言问题生成模块、图片生成模块以及语音合成模块模块,其中:自然语言问题生成模块与图片生成模块、语音合成模块相连,并输出图片生成规则到图片生成模块,输出自然语言问题字符串到语音合成模块,输出问题答案;图片生成模块与自然语言问题生成模块相连并接收图片生成规则,输出最终生成的图片;语音合成模块与自然语言问题生成模块相连并接收自然语言问题字符串,输出最终合成的语音;所述的语音合成模块包括:数据持久单元、参数调整单元、自适应合成单元、统计合成单元,其中:数据持久单元与参数调整单元和自适应合成单元相连,向参数调整单元发送预先存储的参数动态调整范围,随机选择事先训练的声音模型、决策树已经自适应数据集并向自适应合成单元发送;参数调整单元与数据持久单元、统计合成单元相连,从数据持久单元接收参数动态调整范围,生成动态调整的参数并向统计合成单元发送;自适应合成单元接收参数调整单元发送的声音模型、决策树以及自适应数据集,对该模型做自适应训练并输出训练得到的声音模型和决策树到统计合成单元;统计合成单元与数据持久单元、参数调整单元、自适应合成单元相连,接收参数调整单元传送的参数并对自适应合成单元传送过来的时长模型进行调整,最后接收自然语言问题生成模块传送的问题字符串,生成问题语音并传送给用户端;所述装置通过生成关联多模态的自然语言问题,根据自然语言问题生成相应图片并加入干扰元素,根据问题文本,使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声,使得破解验证码的难度由单模态的验证码破解概率提升到几个单模态的验证码破解概率的叠加,在不降低用户体验的基础上提高了验证码的人机区分度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;苏州思必驰信息科技有限公司,未经上海交通大学;苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510272044.4/,转载请声明来源钻瓜专利网。
- 上一篇:海洋能发电装置及其内置模块
- 下一篇:双回路EGR阀及具有其的车辆