[发明专利]用于对发声过程进行分类的方法和装置有效
申请号: | 200980116168.6 | 申请日: | 2009-03-12 |
公开(公告)号: | CN102317770A | 公开(公告)日: | 2012-01-11 |
发明(设计)人: | H.赫格 | 申请(专利权)人: | 西门子公司 |
主分类号: | G01N29/44 | 分类号: | G01N29/44;G01N29/14 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张涛;李家麟 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 发声 过程 进行 分类 方法 装置 | ||
1.一种用于对发声过程(P)进行分类的方法,具有以下的步骤:
(a)采集(S1)由发声过程(P)所引起的声音信号;
(b)从所采集的声音信号中为相应的过程(P)提取(S2)特征(m);
(c)基于所提取的特征(m)来计算(S3)所采集的声音信号之间的相似性,以将具有彼此相似的声音信号的过程(P)分组到过程群集(C)中;
(d)根据包含在如下过程群集(C)中的那些过程(P)的统计学分布参数来适配(S4)参考模型的统计学分布参数以生成适配的模型:所述过程群集(C)具有最高数量(Z)的分组在其中的过程(P);
(e)基于所适配的模型对发声过程(P)进行分类(S5)。
2.按照权利要求1的方法,其中由机器的工作过程生成所述声音信号。
3.按照权利要求1的方法,其中由设备的化学过程生成所述声音信号。
4.按照权利要求1的方法,其中由空气声音信号或由固体声音信号形成所述声音信号。
5.按照权利要求1的方法,其中所采集的声音信号由传感器(2)转换成电信号。
6.按照权利要求1的方法,其中所采集的电信号由低通滤波器(9)进行低通滤波。
7.按照权利要求6的方法,其中模拟声音信号由模数转换器(10)转换成数字信号。
8.按照权利要求7的方法,其中对于数字化声音信号的预先给定的时间窗进行频率变换以生成声音信号谱。
9.按照权利要求8的方法,其中从时域中或从频域中提取声音信号的特征(m)。
10.按照权利要求1的方法,其中对于每个发声过程(P)在不同测量时刻(t)形成具有所提取的特征(m)的特征矢量(V)。
11.按照权利要求10的方法,其中从一个过程(P)的多个特征矢量(V)中对于每个特征(m)计算统计学分布参数。
12.按照权利要求11的方法,其中特征(m)的统计学分布参数具有相应特征(m)的平均值(μ)和方差(Γ2)。
13.按照权利要求1的方法,其中对不同声音信号的统计学分布参数之间的间距(Δ)进行计算以确定在这些声音信号之间的相似性。
14.按照权利要求13的方法,其中将过程(P)的彼此相似的声音信号分组到一个过程群集(C)中,其中所述声音信号的统计学分布参数彼此具有微小间距。
15.按照权利要求1的方法,其中基于由样机输出的声音信号的所提取特征(m)来计算参考模型的统计学分布参数。
16.按照权利要求14的方法,其中分别确定在所形成的不同过程群集(C)内的过程(P)的数量(Z)。
17.按照权利要求16的方法,其中选择分组在其中的过程(P)的数量(Z)为最大的那个过程群集(C)。
18.按照权利要求1的方法,其中基于所适配的模型借助于最大似然法对发声过程(P)进行分类。
19.一种用于对发声过程(P)进行分类的装置,具有:
(a)至少一个传感器(2),用于采集由发声过程(P)所引起的声音信号;
(b)存储器(6),用于存储具有声音信号的预先给定特征(m)的统计学分布参数的参考模型;
(c)适配单元(4),用于从过程(P)的所采集的声音信号中提取特征(m)并且用于根据所提取的特征(m)来计算所采集的声音信号之间的相似性以将过程(P)分组到不同的具有彼此相似声音信号的过程群集(C)中,其中适配单元(4)根据包含在具有最大数量(Z)的过程(P)的过程群集(C)中的那些过程(P)的统计学分布参数来适配所存储的参考模型;
(d)以及具有分类单元(7),该分类单元(7)基于所适配的参考模型来对发声过程(P)进行分类。
20.一种用于执行按照权利要求18的方法的计算机程序。
21.一种存储按照权利要求20的计算机程序的数据载体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980116168.6/1.html,转载请声明来源钻瓜专利网。