[发明专利]一种远程汉语教学中的说话人确认系统无效
申请号: | 200810101950.8 | 申请日: | 2008-03-14 |
公开(公告)号: | CN101241699A | 公开(公告)日: | 2008-08-13 |
发明(设计)人: | 苗振江;明悦;王琛 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G09B5/08 |
代理公司: | 北京市商泰律师事务所 | 代理人: | 吴克宇;毛燕生 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 远程 汉语 教学 中的 说话 确认 系统 | ||
1.一种远程汉语教学中的说话人确认系统,其特征在于:该系统包含用户注册、用户登录和汉语发音学习三大阶段,其中:
(1)用户注册阶段为用户选择是否运用说话人确认机制进行身份确认,如果选择“是”则为该用户建立他个人的语料库,反之则不建立语料库在用户以后登陆时也不进行说话人确认工作;
(2)用户登录阶段又分为身份确认模块和用户判断模块,用户进入系统首页,即进入了用户登录阶段,在身份确认模块输入用户名和密码,通过用户判断模块进行处理用户名和密码一致则为注册用户,允许登陆系统,反之非注册用户拒绝登陆系统;
(3)汉语发音学习阶段则分为说话人确认模块和用户确认后处理模块;确认模块处理过程包括训练和确认两个阶段,训练过程是根据用户建立的语料库进行训练提取特征参数,系统据此确定模型参数;确认过程是由待识人说的语音经特征提取后与系统在训练时通过EM算法重估高斯混合模型(GMM)、全局背景模型(UBM)的模型参数,并进行比较,进而得到确认结果;若为正式注册用户就记录他的学习过程供下次使用,若为非正式注册用户就不记录相关学习信息。
2.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:特征提取阶段对原始语音信号经过预加重、分帧、加窗后,将该时域信号补0进行离散傅立叶变换(DFT),所得线性频谱经过Mel滤波器组得到Mel频谱,再经过离散余弦变换得到Mel频率倒谱系数(MFCC);采用跳跃取点的方式加速运算速度;并将得到的MFCC进行变换使之满足特定的高斯分布以减少噪声干扰。
3.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:采用高斯混合模型(GMM)描述用户模型,其中对于模型的权重、均值、协方差矩阵参数的最大似然重估采用EM算法实现。
4.根据权利要求1所述的一种远程汉语教学中的说话人确认系统,其特征在于:通过K均值聚类和EM迭代算法训练一个与说话人无关的全局背景模型(UBM),它本质上是一个大型的GMM模型,使用所有待识别说话人的特征分布特性,为了提高计算效率我们采用一种筛选树的方法,从UBM中选取前6个最佳高斯分量,利用用户模型中相对应的6个高斯分量计算每个说话人模型的概率值,提高识别速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810101950.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:触摸屏装置
- 下一篇:一种手写汉字快速识别和输入仪