[发明专利]声音分段设备和方法以及说话者识别系统有效
申请号: | 201110217652.7 | 申请日: | 2011-08-01 |
公开(公告)号: | CN102915728A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 郭莉莉;穆向禹;刘贺飞 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/14;G10L17/14 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 魏小薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 分段 设备 方法 以及 说话 识别 系统 | ||
1.一种声音分段方法,包括:
多级分段步骤,所述多级分段步骤包括:
当前声音段分段步骤,所述当前声音段分段步骤包括:
确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及
分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段,
其中,通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。
2.根据权利要求1的声音分段方法,其中
各个声音段构成树结构中的各个节点,
对应于树结构的根节点的声音段是根声音段,以及
当每一级中的未被分割的声音段都不满足所述规定条件时,对应于树结构的叶子节点的声音段是叶子声音段。
3.根据权利要求2的声音分段方法,其中
当对应于特定声音段的特定节点具有树结构中的祖先节点时,所述祖先节点对应于所述特定声音段的祖先声音段。
4.根据权利要求2的声音分段方法,其中
所述规定条件包括:对应于当前声音段的部分分割分数序列具有局部极大值,
其中,所述部分分割分数序列是根声音段的分割分数序列的一部分,并且对应于所述当前声音段,
其中,所述分割分数序列中的每个值指示当对应于该值的点被作为根声音段的分割点时获得的信息熵,以及
在所述分割步骤中,在部分分割分数序列中具有最大的局部极大值的点处或者具有最大的局部极大值的点的邻域内的点处分割所述当前声音段。
5.根据权利要求4的声音分段方法,还包括:
特征序列提取步骤,从所述根声音段提取声音特征序列,
其中,所述分割分数序列是从所述声音特征序列计算的。
6.根据权利要求3的声音分段方法,还包括:
分类步骤,对通过所述多级分段步骤获得的所有级别的各声音段进行分类,以获得所述各声音段的声音类别和对于将该声音段分类为所述声音类别的置信度分数;以及
分类验证步骤,确定叶子声音段及其所有祖先声音段当中具有最大置信度分数的声音段的声音类别,作为所述叶子声音段的声音类别。
7.根据权利要求2的声音分段方法,其中
所述当前声音段分段步骤还包括:当前声音段分类步骤,对所述当前声音段进行分类,以获得所述当前声音段的声音类别和对于将该当前声音段分类为所述声音类别的置信度分数,
其中,所述规定条件包括:当前声音段的置信度分数小于预定的置信度分数阈值。
8.根据权利要求7的声音分段方法,其中
所述规定条件还包括:当前声音段的分割分数序列具有局部极大值,
其中,所述分割分数序列中的每个值指示当对应于该值的点被作为当前声音段的分割点时获得的信息熵,以及
在所述分割步骤中,在所述分割分数序列中具有最大的局部极大值的点处或者具有最大的局部极大值的点的邻域内的点处分割所述当前声音段。
9.根据权利要求8的声音分段方法,还包括:
特征序列提取步骤,从所述根声音段提取声音特征序列,
其中,所述分割分数序列是从所述声音特征序列的对应于当前声音段的部分计算的。
10.根据权利要求1-9中的任一项的声音分段方法,其中
所述规定条件还包括:当前声音段的长度大于预定的长度阈值。
11.根据权利要求6-9中的任一项的声音分段方法,还包括:
合并步骤,如果相邻的叶子声音段具有相同的声音类别,则合并所述相邻的叶子声音段。
12.根据权利要求4、8和9中的任一项的声音分段方法,其中
所述分割分数序列是Delta贝叶斯信息准则序列。
13.根据权利要求2-9中的任一项的声音分段方法,还包括:
非静音声音段检测步骤,检测非静音声音段作为所述根声音段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110217652.7/1.html,转载请声明来源钻瓜专利网。