[发明专利]语音音节时长的自动归一化有效
申请号: | 201110184224.9 | 申请日: | 2011-05-17 |
公开(公告)号: | CN102254553A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 特里·詹宁斯;保罗·若勒·麦克里斯 | 申请(专利权)人: | 阿瓦雅公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/10 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤 |
地址: | 美国新*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 音节 自动 归一化 | ||
1.一种提高通信可理解性的方法,包括:
接收语音;
在接收的语音中标识一个或多个不同语音事件;
将所述一个或多个不同语音事件中的一个或多个表示为可调节语音生成参数;
利用知识库来确定因错误发音引起的不正确音节时长;以及
调节错误发音以对错读音节进行延长、缩短、强调或去强调中的一者或多者。
2.如权利要求1所述的方法,还包括:
检测正被讲的语言;
检测讲话者的本土语言;
利用正被讲的语言和讲话者的本土语言的发音模式和词汇来检测因所述错误发音引起的所述不正确音节时长;以及
使用经修改的语音产品参数重新生成具有经纠正音节定时的语音,并呈现给一个或多个收听者。
3.如权利要求1所述的方法,还包括:判断话音是否是合法单词。
4.如权利要求1所述的方法,还包括:判断话音是否是常见的错误发音,并且向讲话者提供反馈。
5.用于执行权利要求1的功能的一个或多个装置,或者存储有指令的非易失性计算机可读信息存储介质,所述指令如果被处理器运行,就使得权利要求1所述的方法被执行。
6.一种提高通信可理解性的系统,包括:
分析模块,该分析模块接收语音;
不同语音事件识别模块,该不同语音事件识别模块与编码和压缩模块合作来标识所接收语音中的一个或多个不同语音事件,并且将所述一个或多个不同语音事件中的一个或多个表示为可调节语音生成参数;以及
修改模块,该修改模块利用知识库来确定因错误发音引起的不正确音节时长,并且调节所述错误发音以对错读音节进行延长、缩短、强调或去强调中的一者或多者。
7.如权利要求6所述的系统,还包括:
语言检测模块,该语言检测模块检测正被讲的语言并且检测讲话者的本土语言,
其中,包括正被讲的语言和讲话者的本土语言的发音模式和词汇的贮存库被用来检测因错误发音引起的所述不正确音节时长,以及
其中,经修改的语音产品参数被用来重新生成具有经纠正音节定时的语音,并且呈现给一个或多个收听者。
8.如权利要求6所述的系统,还包括处理器,该处理器判断话音是否是合法单词,并且其中,所述分析模块还判断话音是否是常见的错误发音。
9.如权利要求6所述的系统,还包括反馈模块,该反馈模块向讲话者提供反馈。
10.如权利要求6所述的系统,其中,参与者能够经由反馈模块来选择经修改的流和未经修改的流中的一个或多个进行收听,并且其中,还判断经修改单词是否是不适当的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿瓦雅公司,未经阿瓦雅公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110184224.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电镀工艺中的活化处理
- 下一篇:1-羟基环己基苯基甲酮的合成工艺