[发明专利]应用于基于矢量量化的说话人识别的三粒子协同优化方法有效

专利信息
申请号: 200910188963.8 申请日: 2009-12-16
公开(公告)号: CN101740029A 公开(公告)日: 2010-06-16
发明(设计)人: 纪震;薛丽萍;周家锐;储颖 申请(专利权)人: 深圳大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/14
代理公司: 深圳市顺天达专利商标代理有限公司 44217 代理人: 易钊;曾少丽
地址: 518060 广东省深圳市南山*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 基于 矢量 量化 说话 识别 粒子 协同 优化 方法
【说明书】:

技术领域

发明涉及语音识别技术领域,更具体地说,涉及一种应用于基于矢量量 化的说话人识别的三粒子协同优化方法。

背景技术

说话人识别是现有通信网络信息技术应用所迫切需求的生物识别技术,可 广泛应用于金融领域、军事领域(如战场环境监听及指挥员鉴别)、医学领域 (如对假肢的控制)、公安司法领域(如罪犯监听与识别)、安全保卫领域(如 机场门禁系统控制)、信息服务领域(如自动信息检索或电子商务)等方面。

说话人模型是实现高性能说话人识别的核心,自20世纪80年代后期,由 于矢量量化、概率统计模型、人工神经网络的说话人模型建立,说话人识别进 入了一个崭新的、欣欣向荣的大发展时期。模型训练即优化作为典型的最优化 问题,对传统的最优化技术提出了严峻的挑战。过去研究者考虑说话人模型的 最优化问题时把重点放在了对确定性优化方法的研究运用上,如LBG算法和 最大期望算法,然而确定性优化方法对求解具有多峰值特点的说话人模型有着 严重的缺陷,难以获得较精确的全局最优解。要想有所突破,必须依赖于新的 算法的研究与应用。训练数据一直是影响说话人识别系统性能的重要因素,要 对每个目标说话人建立一套模型,这必然要求尽量多的目标说话人的训练数 据。而实际应用系统中,由于说话人识别大多数应用是在目标说话人不愿意主 动配合的情况下完成对目标说话人的验证工作,因此目标说话人的大量语音往 往是无法获得的,对于训练和识别语音时间低于10秒的短语音实际应用背景, 系统识别性能会严重恶化,如何建立最优的短语音说话人模型是当前仍未解决 的难点问题。

一、基于矢量量化的说话人识别方法

说话人识别系统的实用化发展,使短语音说话人识别成为一个关键问题。 对于较少的训练语音,概率统计模型无法得到较准确的模型估计参数,矢量量 化(Vector Quantization,VQ)的方法可以取得较好的识别效果。矢量量化是非参 数(模板)模型,它是基于这样的假设,每个说话人的语音数据的特征矢量都 有一定的分布,这种分布就是该说话人与别人区分开来的信息。矢量量化方法 是试图描述这一分布,根据每个说话人训练数据基于失真最小化原则为其建立 码本模型(Code-Book Model,CBM)。识别时,从待识别的语音中提取一组 特征矢量,对每个码本模型进行矢量量化,求取平均量化误差,对应于最小平 均量化误差的码本的说话人便是识别的结果。这种方法具有较小的存储要求和 计算开销。基于矢量量化的说话人识别系统框图如图1所示。

在基于矢量量化的说话人识别方法中,码本设计是关键问题。码本设计的 主要目标是找到训练矢量的一个最佳分类,即将说话人的T个L维的训练矢 量分成M个类别的最佳方案。好的码本能最大程度地提高矢量量化的效果, 更准确地描述原始训练样本数据的分布。码本一般是有限空间的一个子空间, 根据先验知识和某种失真测度,对大量的训练数据进行聚类而得到的。码本设 计也是一个迭代的过程,可以视为一个多峰多极值问题,如同函数优化,其最 优码本的搜索也需要优化算法的策略。因此,人们不断从新提出的优化算法中 寻求新的码本设计优化策略,例如以下的粒子群优化算法、混合蛙跳算法以及 LBG算法。

二、粒子群优化算法和混合蛙跳算法

粒子群优化算法(Particle Swarm Optimization,PSO)是源于自然中社会性 生物世界的仿生类算法,基于人工生命理论以及鸟类、鱼类的群集现象,凭借 其简单的算法结构和优异的问题求解能力,吸引了众多研究者,并取得了令人 注目的成果。粒子群优化算法将群体中的每个个体视为多维搜索空间中一个没 有质量和体积的粒子(点),每个粒子都为优化问题的一个可行解,并由目标 函数为之确定一个适应值(Fitness Value)。这些粒子在解空间中以一定的速度 飞行,并根据粒子本身的飞行经验以及同伴的飞行经验对自己的飞行速度进行 动态调整,即每个粒子通过迭代过程中自身的最优值pi和群体的最优值pg来不 断地修正自己的前进方向和速度大小,逐步移到较优的区域,并最终搜索、寻 找到问题的最优解。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910188963.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top