[发明专利]声音处理装置以及声音处理方法有效
申请号: | 201410189831.8 | 申请日: | 2014-05-07 |
公开(公告)号: | CN104143332B | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 井手博康 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L17/02 |
代理公司: | 北京银龙知识产权代理有限公司11243 | 代理人: | 许静,李家浩 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种声音处理装置以及声音处理方法。声音处理装置的特征为,具备获取声音数据中包含的元音区间的特征量的获取单元;按照每个元音通过非监督分类法将所述获取到的特征量中与多个相同元音对应的特征量,分类为多个集群的分类单元;以及对所述多个元音从分类的集群中决定与相同说话人对应的集群组合的决定单元。 | ||
搜索关键词: | 声音 处理 装置 以及 方法 | ||
【主权项】:
一种声音处理装置,其特征在于,该声音处理装置具备:获取单元,其获取声音数据所包含的元音区间的特征量;分类单元,其通过非监督分类法将所获取到的特征量中与相同元音对应的多个特征量按照多个元音中的每个元音分类为多个集群;决定单元,其根据对所述多个元音进行了分类的集群来决定与相同说话人对应的集群组合;区分单元,其根据包含在作为所述相同说话人而决定了组合的集群中的特征量的元音区间在所述声音数据中出现的定时,按说话人来区分所述声音数据的声音区间;以及输出单元,其输出表示所述区分单元得到的区分结果的信息,其中,所述决定单元根据分别包含在所述进行了分类的集群中的特征量的元音区间在所述声音数据中出现的定时,决定与相同说话人对应的集群的组合;其中,所述决定单元,分别对成为与所述相同说话人对应的集群的组合的候补的多个组合,决定表示与相同说话人对应的程度的组合分值,根据所述决定单元所决定的组合分值,决定与所述相同说话人对应的集群的组合;其中,所述分类单元对所述相同说话人使用的语言所包含的元音中的至少三个元音执行进行分类的处理;并且其中,所述决定单元,对从由所述分类单元对不同的两个元音进行分类的集群中一个一个提取出的集群对,决定表示与相同说话人对应的程度的对分值,由所述分类单元执行了分类处理的每个元音一个一个提取集群,生成成为候补的组合,根据对成为所生成的候补的组合所包含的集群对而决定的对分值,决定所述组合分值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410189831.8/,转载请声明来源钻瓜专利网。