[发明专利]说话者识别系统有效
申请号: | 02816220.X | 申请日: | 2002-06-13 |
公开(公告)号: | CN1543641A | 公开(公告)日: | 2004-11-03 |
发明(设计)人: | 安德鲁·托马斯·萨佩利克 | 申请(专利权)人: | 塞库里沃克斯公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 朱进桂 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 说话者识别(验证和/或辨别)方法和系统,其中登记说话者的语音模型由表示多个帧中每一个的平滑频谱的特征矢量集合组成并且将聚类算法用于帧的特征矢量以得到表示原始语音采样的减小的数据集合,且其中相邻帧至少重叠80%。这种类型的语音模型将语音采样的静态分量建模并显示出时间独立性。使用了其中进行建模和分类处理选择的辨别者策略以给出实质上等于零的误拒绝率。每一个登记的说话者与其他预定个数的登记说话者的群组相关并且测试采样始终或者与要求的身份或者与其相关群组之一匹配。这使得系统的整个错误率只取决于由群组大小确定的误接受率。使用多并行建模和/或分类处理进一步减小了错误率。在分类之前利用源自或者测试语音采样或者登记说话者采样之一(最优选地是要求身份的登记采样)的归一化模型对语音模型进行归一化。 | ||
搜索关键词: | 说话 识别 系统 | ||
【主权项】:
1.一种在说话者识别系统中处理语音采样以得到用于语音采样模型的方法,包括:将语音采样分为多个帧;对于每一个帧,得到表示该帧平滑频率谱的特征矢量集合;将聚类算法应用于帧的特征矢量以得到表示了原始语音信号的减小的数据集合;其特征在于相邻帧至少重叠80%。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞库里沃克斯公司,未经塞库里沃克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/02816220.X/,转载请声明来源钻瓜专利网。
- 上一篇:半导体组件的多重间隙壁宽度的制造方法
- 下一篇:用于提高癌症治疗疗效的方法