[发明专利]语音韵律评估方法与系统有效
申请号: | 201010163229.9 | 申请日: | 2010-04-30 |
公开(公告)号: | CN102237081A | 公开(公告)日: | 2011-11-09 |
发明(设计)人: | 施琴;张世磊;双志伟;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/08;G10L15/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;杨晓光 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 韵律 评估 方法 系统 | ||
1.一种语音韵律评估方法,包括:
接收输入语音数据;
获取韵律约束条件;
按照所述韵律约束条件对所述输入语音数据的韵律进行评估;以及
提供所述评估的结果。
2.一种如权利要求1所述的方法,其中所述韵律约束条件包括节奏特征约束条件。
3.一种如权利要求2所述的方法,所述方法进一步包括:
获取所述输入语音数据的节奏特征,
所述获取韵律约束条件的步骤进一步包括:
获取所述输入语音数据对应的标准节奏特征,并且
所述按照所述韵律约束条件对所述输入语音数据的韵律进行评估的步骤进一步包括:
将所述输入语音数据的节奏特征与对应的标准节奏特征进行比较。
4.一种如权利要求3所述的方法,其中所述节奏特征表现为节奏边界位置,所述节奏边界包括下列各项中的至少一项:停顿、音调重置。
5.一种如权利要求4所述的方法,其中将所述输入语音数据的节奏特征与对应的标准节奏特征进行比较的步骤进一步包括:
查看所述输入语音数据的节奏边界位置与标准节奏特征的节奏边界位置是否匹配。
6.一种如权利要求4所述的方法,所述获取所述输入语音数据的节奏特征的步骤进一步包括:
获取所述输入语音数据对应的输入文字数据;
将所述输入文字数据与输入语音数据进行对齐;以及
测量所述输入语音数据的节奏边界位置。
7.一种如权利要求6所述的方法,所述获取所述输入语音数据对应的标准节奏特征的步骤进一步包括:
处理所述输入文字数据以获得对应的输入语言结构;
将所述输入语言结构与标准语料库中的标准语音的标准语言结构进行匹配以确定所述输入文字数据的节奏边界位置的发生概率;以及
提取所述标准节奏特征的节奏边界位置。
8.一种如权利要求7所述的方法,其中所述提取所述标准节奏特征的节奏边界位置的步骤进一步包括:
提取所述发生概率在一定阈值以上的节奏边界位置。
9.一种如权利要求7所述的方法,所述将所述输入语言结构与标准语料库中的标准语音的标准语言结构进行匹配以确定所述输入文字数据的节奏边界位置的发生概率的步骤包括:
按照所述输入文字数据的至少一个字的输入语言结构,遍历所述标准语言结构的决策树以确定该至少一个字的节奏边界位置的发生概率。
10.一种如前述任意一个权利要求所述的方法,其中所述韵律约束条件包括流利度特征约束条件,
所述方法进一步包括:
获取所述输入语音数据的流利度特征。
11.一种如权利要求10所述的方法,所述获取所述输入语音数据的流利度特征的步骤进一步包括:
获取所述输入语音数据对应的输入文字数据;
将所述输入文字数据与输入语音数据进行对齐;以及
测量所述输入语音数据的流利度特征。
12.一种如权利要求11所述的方法,其中所述流利度特征包括一个句子内的节奏边界总数,所述节奏边界包括下列各项中的至少一项:停顿、音调重置,
所述获取韵律约束条件的步骤进一步包括:
根据所述输入语音数据对应的文字数据的句子长度确定节奏边界总数的预测值,
所述按照所述韵律约束条件对所述输入语音数据的韵律进行评估的步骤进一步包括:
将所述输入语音数据的节奏边界总数与所述节奏边界总数的预测值进行比较。
13.一种如权利要求10所述的方法,其中所述流利度特征包括节奏边界的停顿长度,
所述获取韵律约束条件的步骤进一步包括:
获取所述输入语音数据对应的标准停顿长度,并且
所述按照所述韵律约束条件对所述输入语音数据的韵律进行评估的步骤进一步包括:
将所述输入语音数据的节奏边界的停顿长度与对应的标准停顿长度进行比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010163229.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:受按钮信号远程控制的断路器及远程控制断路器的方法
- 下一篇:一种镜片削切机