[发明专利]一种远程汉语教学中的说话人确认系统无效

申请号：	200810101950.8	申请日：	2008-03-14
公开（公告）号：	CN101241699A	公开（公告）日：	2008-08-13
发明（设计）人：	苗振江;明悦;王琛	申请（专利权）人：	北京交通大学
主分类号：	G10L17/00	分类号：	G10L17/00;G09B5/08
代理公司：	北京市商泰律师事务所	代理人：	吴克宇;毛燕生
地址：	100044***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种远程汉语教学中的说话确认系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种远程汉语教学中的说话人确认系统，其特征在于：该系统包含用户注册、用户登录和汉语发音学习三大阶段，其中：

(1)用户注册阶段为用户选择是否运用说话人确认机制进行身份确认，如果选择“是”则为该用户建立他个人的语料库，反之则不建立语料库在用户以后登陆时也不进行说话人确认工作；

(2)用户登录阶段又分为身份确认模块和用户判断模块，用户进入系统首页，即进入了用户登录阶段，在身份确认模块输入用户名和密码，通过用户判断模块进行处理用户名和密码一致则为注册用户，允许登陆系统，反之非注册用户拒绝登陆系统；

(3)汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块；确认模块处理过程包括训练和确认两个阶段，训练过程是根据用户建立的语料库进行训练提取特征参数，系统据此确定模型参数；确认过程是由待识人说的语音经特征提取后与系统在训练时通过EM算法重估高斯混合模型(GMM)、全局背景模型(UBM)的模型参数，并进行比较，进而得到确认结果；若为正式注册用户就记录他的学习过程供下次使用，若为非正式注册用户就不记录相关学习信息。

2.根据权利要求1所述的一种远程汉语教学中的说话人确认系统，其特征在于：特征提取阶段对原始语音信号经过预加重、分帧、加窗后，将该时域信号补0进行离散傅立叶变换(DFT)，所得线性频谱经过Mel滤波器组得到Mel频谱，再经过离散余弦变换得到Mel频率倒谱系数(MFCC)；采用跳跃取点的方式加速运算速度；并将得到的MFCC进行变换使之满足特定的高斯分布以减少噪声干扰。

3.根据权利要求1所述的一种远程汉语教学中的说话人确认系统，其特征在于：采用高斯混合模型(GMM)描述用户模型，其中对于模型的权重、均值、协方差矩阵参数的最大似然重估采用EM算法实现。

4.根据权利要求1所述的一种远程汉语教学中的说话人确认系统，其特征在于：通过K均值聚类和EM迭代算法训练一个与说话人无关的全局背景模型(UBM)，它本质上是一个大型的GMM模型，使用所有待识别说话人的特征分布特性，为了提高计算效率我们采用一种筛选树的方法，从UBM中选取前6个最佳高斯分量，利用用户模型中相对应的6个高斯分量计算每个说话人模型的概率值，提高识别速度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京交通大学，未经北京交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810101950.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种远程汉语教学中的说话人确认系统无效

专利文献下载