[发明专利]语音命令控制器无效
申请号: | 99123747.1 | 申请日: | 1999-11-19 |
公开(公告)号: | CN1256460A | 公开(公告)日: | 2000-06-14 |
发明(设计)人: | 郑方;吴文虎;方棣棠 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F13/10 | 分类号: | G06F13/10;G06F3/16 |
代理公司: | 清华大学专利事务所 | 代理人: | 廖元秋 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 命令 控制器 | ||
本发明属于计算机语音识别技术领域,特别涉及一种用于家电控制以及声控电话簿、声控电话机、袖珍式声控拨号器等产品上的语音命令控制器。
目前家用电器的控制有两种方式:一是用手直接操作按钮,如电视机、洗衣机、微波炉、空调等;二是通过遥控器进行操作,如电视机、空调等。
随着家电的技术不断完善和发展,功能不断增多,家电的说明手册也越来越厚。由于家电的控制面板不能太大,按钮不能太多,因此很多按钮需要复用,对于某种功能就往往需要几个按钮操作结合起来才能完成。在这样的情况下,有时为了进行某种功能的操作,往往要翻半天的说明书,给人们带来很多不便。
另外以目前在家庭中最常用的电话为例,由于人们的活动范围不断扩大、工作、学习和生活上的需要,每天都要给不同的人或单位打电话,这就需要记忆和查找电话号码,而记忆大量电话号码是一个令人心烦的过程,如果不去记忆,就要每次去翻阅电话号码簿,既费时又费事。
众所周知,目前大家记录电话号码的方法无外乎以下两种:(1)用笔记录到一个电话簿(下称“纸张电话簿”)上;(2)记录到类似个人数字助理等的电子产品(下称“一般电子电话簿”)上。不管哪种方法,一个最大的问题是号码的输入、修改和查询。
对于纸张电话簿,虽然一些生产厂家生产了带有A-Z标签的纸张电话薄,但由于无法预计到不同用户的实际情况,印刷时一般总是让每个标签的页数相同。但在实际使用时,大部分的情形是,在有的标签可能一个姓名没有时有的标签却已经用完了(如Z标签有“张”,“郑”,“周”,...等姓氏非常多),用完的标签只好用其他标签来补充。这样既比较混乱,又导致查找时困难。对没有设计标签的一般纸张电话簿来说,查询就更加麻烦了,有时为了找到一个人的电话号码要翻找好多页。纸张电话簿的另外一个缺点是号码修改不方便,有时由于号码改变了,不得不把相应的地方用笔涂掉,很不雅观。
对一般电子电话簿来说,它可以很好地解决纸张电话簿中的人名排序、电话号码修改等问题,而且可以通过键盘较好地解决人名的查询问题。但其不方便之处是人名的查询仍然不是特别方便。类似于手机,查询的方法一般是先输入姓名的首字母,然后再用前翻或后翻键去找需要的人名。
因此,随着家用电器高技术含量和功能的不断提高,操作简便灵活的要求就提到了日程。
本发明突破了传统控制家电的方法,提出了用语音控制家电的构想。
语音是最自然的一种人机交互方式,随着计算机的飞速发展和语音处理技术的日益成熟,人们希望把语音识别技术应用到实际产品中的愿望正一步一步地成为现实。尤其是特定人中词表孤立词语音识别技术的成熟以及低成本、高性能的单片机数字信号处理器的出现,使得人们在日常工作和生活中应用高新技术——语音识别技术——成为可能。
本发明的目的是为克服已有技术的不足之处,提出一种语音命令控制器,将语音识别技术用于家电产品的控制以及声控电话簿、声控电话机、袖珍式声控拨号器等新产品上,可大大方便使用者,提高人们的工作效率和生活的质量。
本发明所提出一种语音命令控制器,其特征在于包括用于进行主要控制和计算的定点数字信号处理器CPU U1;用于存放程序和初始化数据的只读存储器U2;用于永久存放语音识别模型/模板以及其他需要保存数据的闪存器U3;对存储器所存数据进行译码的译码器U4;用于进行语音输入和输出的CODEC编码译码器U5;用于进行音频放大的音频放大器U6,扬声器和麦克风;以及存储在该闪存器中的语音命令的训练和识别软件。图1中各元件的连接关系为:只读存储器和闪存器通过数据总线和地址总线与数字信号处理器相连;译码器一端与数字信号处理器相连,另一端与只读存储器和闪存器相连;编码译码器一端连于数字信号处理器的串行接口,另一端连于音频放大器输入端和麦克风,音频放大器输出端与扬声器相连。
本发明的语音处理工作过程结合图1说明如下:
CPU U1在上电后自动将只读存储器U2中的程序(包括不同用户定制的控制程序和本发明编制的核心程序)调入CPU并进行控制。在CPU的控制下,用户的语音经过“麦克风”转变为电信号后,进入“CODEC语音输入输出”U5并被转换为数字信号。这些数字信号经过CPU的串行口传送到CPU中,CPU会根据不同的功能进行不同的处理。此时的处理有以下两种。
1.训练,即用户训练预先设定的语音命令并存储其语音模型。核心处理程序把语音经过特征抽取和建模后转换为高度压缩的语音模型,并把这些模型存储在“闪存器”U3中,以便以后控制时使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99123747.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全色场顺序式彩色显示器件
- 下一篇:一种机动车消烟消声防火除尘净化器