[发明专利]语音命令控制器无效
申请号: | 99123747.1 | 申请日: | 1999-11-19 |
公开(公告)号: | CN1256460A | 公开(公告)日: | 2000-06-14 |
发明(设计)人: | 郑方;吴文虎;方棣棠 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F13/10 | 分类号: | G06F13/10;G06F3/16 |
代理公司: | 清华大学专利事务所 | 代理人: | 廖元秋 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 命令 控制器 | ||
1、一种语音命令控制器,其特征在于,包括用于进行主要控制和计算的定点数字信号处理器CPU U1,用于存放程序和初始化数据的只读存储器U2,用于永久存放语音识别模型/模板以及其他需要保存数据的闪存器,对存储器所存数据进行译码的译码器U4,用于进行语音输入和输出的CODEC编码译码器U5,用于进行音频放大的音频放大器U6,扬声器与麦克风,以及存储在该闪存器中的语音命令的训练和识别软件;所说的各元件的连接关系为:只读存储器和闪存器通过数据总线和地址总线与数字信号处理器相连,译码器一端与数字信号处理器相连,另一端与只读存储器和闪存器相连;编码译码器一端连于数字信号处理器的串行接口,另一端连于音频放大器输入端和麦克风,音频放大器输出端与扬声器相连。
2、一种用于如权利要求1所述的语音命令控制器的语音命令的训练方法,其特征在于,包括以下步骤:
(1)启动CODEC采集过程:打开ADC(模数转换)器件,开始对声音采样;
(2)采集一遍语音命令的有效发音:当自动检测到语音开始后,把采样到的语音数据逐一记录在内存中,检测到语音结束后,停止记录;
(3)对上一步记录的语音数据进行特征提取,即提取倒谱特征系数,并对语音按特征序列进行非线性分段;
(4)将倒谱系数及分段结果保存于存储器中,以便用于训练过程中的建模;
(5)如果训练未满三遍,转到2,继续训练;否则,到下一步;
<1>建立该语音命令的模型并保存:利用提取的特征进行建模,将模型存
到闪存,将来用于识别;
<2>结束。
3、一种用于如权利要求1所述的语音命令控制器的语音命令的识别方法,其特征在于,包括以下步骤:
(1)启动CODEC采集过程:打开ADC(模数转换)器件,开始对声音采样;
(2)采集一段有效发音:当自动检测到语音开始后,将采样到的语音数据记录在内存中,检测到语音结束后,停止记录;
(3)对上一步记录的语音数据进行特征提取,即提取倒谱系数,并对语音按特征序列进行非线性分段;
(4)暂存倒谱特征系数及分段结果,以便用于识别;
(5)将上一步得到的语音特征与所有已经存在的命令模型进行比较,记下最匹配的三个命令模型;
<5.1>取一个已存的命令模型计算其匹配概率;
<5.2>将该概率值(含命令序号)与保存三个最大概率值的结果数组比较,按情况更新结果数组;
<5.3>命令比较未完,转到<5.1>;
<1>根据结果数组中三个最大概率值进行拒识判别:根据三个最匹配的模型的匹配概率判断是接受识别结果还是拒绝接受;
<2>将结果数组(概率值以及命令序号)和识别接受/拒绝标志保存于参数交换区:保存识别结果;
<3>结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99123747.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全色场顺序式彩色显示器件
- 下一篇:一种机动车消烟消声防火除尘净化器