[实用新型]多功能语音识别记事本及大容量数字录音一体机无效

专利信息
申请号: 00233477.1 申请日: 2000-05-22
公开(公告)号: CN2424513Y 公开(公告)日: 2001-03-21
发明(设计)人: 刘加;刘润生;薛晓光 申请(专利权)人: 清华大学;北京安可尔通讯技术有限公司
主分类号: G10L15/00 分类号: G10L15/00;G06F17/00
代理公司: 清华大学专利事务所 代理人: 廖元秋
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多功能 语音 识别 记事本 容量 数字 录音 一体机
【说明书】:

本实用新型发明属于语音技术领域,尤其是涉及采用单片数字信号处理器或微控制器实现语音识别、语音合成、语音编解码的多功能语音记事本或语音个人数字助理的设计。

语音技术—包括语音编码、语音合成,尤其是语音识别技术在九十年代逐步成熟,语音产品在市场上开始出现。目前国际上,特别是欧美市场已经可以买到很多语音技术产品,如:美国东芝公司生产的语音记事本,日本东芝公司、韩国三星公司生产的语音数字录音机,以及具有语音识别功能一些移动电话手机等。这类语音数字录音机、语音记事本一般包括语音识别或语音压缩专用芯片、A/D、D/A、微控制器、外接存储器、麦克风、喇叭等部件。语音识别或语音压缩专用芯片中存有语音识别、语音合成、或语音编码程序。在这类产品中,语音记事本通常不包括数字语音录音功能,或仅仅能够纪录很短的数字语音录音(1-2分钟)。而且使用的语音识别技术对汉语语音识别的性能并不很好,对一些易混的汉语语音如:“李宁”,“李平”,“李星”等相似汉语发音的识别率很低,对汉语数码语音“0,1,2,3,4,5,6,7,8,9”的识别性能就更差。国内也有一些公司开始从事语音技术产品的开发,如广东江门三特电子科技有限公司生产的语音电子记事本,但其语音识别性能与语音压缩编码的质量都不理想。对录制数字语音也没有时间检索功能,因此使用非常不方便。另外这些产品的各个语音功能往往互相分离,没有集成在一块单片上。

本实用新型的目的旨在为克服已有技术的不足之处,将本申请人开发的特定人语音识别、语音压缩编码、语音合成等处理程序同时固化在数字信号处理芯片上。使其不仅能够识别易混汉语语音,能够识别汉语数码语音,语音识别率为99%,达到实用水平,而且具有集成度高,功能多,综合性能比好,成本低,体积小,重量轻,以及耗电省的突出特点。

本实用新型提出的一种多功能语音识别记事本及大容量数字录音一体机(简称语音记事通),包括数字信号处理器、语音采样编解码器、微控制器、闪烁存储器、电源管理器、麦克风、喇叭。其特征在于,所说的数字信号处理器通过数据线和控制线与采样编解码器及微控制器相连,并且通过数据线、地址线和控制线与闪烁存储器相连,通过控制线与所说的电源管理器相连;所说采样编解码器与麦克风、喇叭,以及信号处理器相连,完成语音采集数模转换与模数转换功能;所说的微控制器通过控制线和数据线与信号处理器、显示控制电路相连,用于控制键盘、显示与命令;所说的数字信号处理器上固化有语音识别、语音合成与语音编码的程序、系统控制程序,以及对存储语音进行时间检索与管理程序。

所说的闪烁存储器可包括两个闪烁存储器,其中的一个用于存储压缩的语音数据,另一个用于存储语音识别的码本,以及需要外存的语音处理程序;所说的电源管理器,通过控制线分别与该两个闪烁存储器相连,并完成电压转换以及节电功能的操作。

所说的微控制器还可固化有一个实现计算、计数功能的计算程序。

本实用新型采用固化有本申请人专门开发的语音处理和管理程序的通用器件,将语音记事本与大容量数字录音合二为一,构成的多功能一体机,具有如下特点:

1、实现特定人汉语数码“0”~“9”语音识别。

2、实现200-400个关键信息(如姓名、单位名)语音识别功能,对易混姓名语音有很高识别率。

3、采用高性能语音压缩编码技术与话音激活技术,实现大容量数码语音录音功能,录音时间可达8小时。在存储数字语音之前,先将语音打上时间标记,因此具有高精度语音检索功能,可以查询到某月某日某时某分某秒的录制的语音信息。

4、具有语音商务信息纪录功能。

5、具有语音提示与语音回放功能,通过语音提示用户进行操作;通过语音回放将用户存入的语音回放出来。

6、具有语音信息检索功能,利用语音识别技术,查询语音关键信息,将查询到有关信息通过屏幕显示或回放语音输出。

7、本实用新型是以数字信号处理器为核心组成的语音识别、语音编码、语音合成模块。任何需要通过语音命令操作代替人手工控制操作场合都可以使用该模块。将该新型结合移动手机中,该手机就具备了语音记事本功能。该模块具有体积小、重量轻、耗电省、成本低等突出特点,将给使用者带来极大方便。在通信、工业控制、家用电器、智能玩具等领域有着极大的应用价值。

附图简要说明:

图1为本实用新型的实施总体结构示意图。

图2为本实施例语音处理模块电路原理图(一)。

图3为本实施例语音处理模块电路原理图(二)。

图4为本实施例语音处理流程框图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京安可尔通讯技术有限公司,未经清华大学;北京安可尔通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/00233477.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top