[发明专利]一种远程汉语教学中的说话人确认系统无效

专利信息
申请号: 200810101950.8 申请日: 2008-03-14
公开(公告)号: CN101241699A 公开(公告)日: 2008-08-13
发明(设计)人: 苗振江;明悦;王琛 申请(专利权)人: 北京交通大学
主分类号: G10L17/00 分类号: G10L17/00;G09B5/08
代理公司: 北京市商泰律师事务所 代理人: 吴克宇;毛燕生
地址: 100044*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 远程 汉语 教学 中的 说话 确认 系统
【权利要求书】:

1.一种远程汉语教学中的说话人确认系统,其特征在于:该系统包含用户注册、用户登录和汉语发音学习三大阶段,其中:

(1)用户注册阶段为用户选择是否运用说话人确认机制进行身份确认,如果选择“是”则为该用户建立他个人的语料库,反之则不建立语料库在用户以后登陆时也不进行说话人确认工作;

(2)用户登录阶段又分为身份确认模块和用户判断模块,用户进入系统首页,即进入了用户登录阶段,在身份确认模块输入用户名和密码,通过用户判断模块进行处理用户名和密码一致则为注册用户,允许登陆系统,反之非注册用户拒绝登陆系统;

(3)汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块;确认模块处理过程包括训练和确认两个阶段,训练过程是根据用户建立的语料库进行训练提取特征参数,系统据此确定模型参数;确认过程是由待识人说的语音经特征提取后与系统在训练时通过EM算法重估高斯混合模型(GMM)、全局背景模型(UBM)的模型参数,并进行比较,进而得到确认结果;若为正式注册用户就记录他的学习过程供下次使用,若为非正式注册用户就不记录相关学习信息。

2.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:特征提取阶段对原始语音信号经过预加重、分帧、加窗后,将该时域信号补0进行离散傅立叶变换(DFT),所得线性频谱经过Mel滤波器组得到Mel频谱,再经过离散余弦变换得到Mel频率倒谱系数(MFCC);采用跳跃取点的方式加速运算速度;并将得到的MFCC进行变换使之满足特定的高斯分布以减少噪声干扰。

3.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:采用高斯混合模型(GMM)描述用户模型,其中对于模型的权重、均值、协方差矩阵参数的最大似然重估采用EM算法实现。

4.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:通过K均值聚类和EM迭代算法训练一个与说话人无关的全局背景模型(UBM),它本质上是一个大型的GMM模型,使用所有待识别说话人的特征分布特性,为了提高计算效率我们采用一种筛选树的方法,从UBM中选取前6个最佳高斯分量,利用用户模型中相对应的6个高斯分量计算每个说话人模型的概率值,提高识别速度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810101950.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top