[其他]一种利用计算机对汉语语音进行识别的装置在审

专利信息
申请号: 101985000000180 申请日: 1985-04-01
公开(公告)号: CN85100180B 公开(公告)日: 1987-05-13
发明(设计)人: 严普强;施昊;靳怀义 申请(专利权)人: 清华大学
主分类号: 分类号:
代理公司: 清华大学专利事务所 代理人: 付尚新
地址: 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 计算机 汉语 语音 进行 识别 装置
【说明书】:

一种计算机识别汉语语音的装置,属于语音识别领域,利用计算机对汉语语音进行识别。这一方法使语音识别装置不依赖于特定使用者,且不受词汇量的限制。本发明将对汉语语音按音素、音节和音调进行识别。对浊音提取基频,由锁相环产生倍频脉冲,并采用同步采样的技术,然后将采样的信号序列进行分析、提取特征、进行识别。这一方法可应用于以自然的汉语语音作为人-机系统的输入。

本发明属于语音识别领域,利用计算机对汉语语音进行识别。

现在通用的语音分析和识别方法都是将语音信号按等时距的方式采样,按时间分帧,对每帧的时序数列求取特征,然后进行识别。这种识别方法严重依赖于语调和讲话速度,因此用这种方法做成的识别装置依赖于特定的人,并且其识别的词汇量也是很有限的。1985年第二期《国际电子报》所列的现在已投入市场的各种语音识别插件板即属此例。

本发明提出一种可以不依赖于特定的使用人并且不受具体词汇量限制的识别装置。这一装置的特点在对语音信号的处理、分析和识别时充分考虑汉语语音的特点和人的发声与听觉的机理。本发明将对汉语语音按音素、音节和音调进行识别。对于由声带振动发出的语音信号,本发明提出采用提取基频和同步采样的技术,然后将采样的信号序列进行分析,提取语音特征,进行识别。

汉语语音是单音节的,每个音节由一至几个音素组成。音节和音素的数量都是有限的。汉语的四声语调和音节中由声带振动发音的浊音音素占有重要的地位。在本发明中将充分考虑汉语的这些特点,浊音信号具有周期或准周期信号的特性,在语调变化时其基频频率是改变的。如果采用等时距的采样技术,则数据量很大而且不可避免地引入泄漏误差等信息模糊。本发明中所用的同步采样技术可以显著地压缩浊音的信息量,它还可以充分地给出语调的特征和语调的变化。

本发明可以发展为用自然的汉语语音作为人-机系统的输入。本发明中的识别方法可以广泛应用于各种领域,例如用语音控制各种半自动装置和工作机械;用语音控制假肢、护理机械;用语音对计算机进行程序编制;声控打字;用语音鉴别身份的安全保密装置等。

本发明提出的语音识别装置框图如附图1所示。a是语音,它由话筒〔1〕检测,转变为电信号。然后通过一个前置放大器〔2〕。放大后的语音电信号通过一个低通滤波器〔3〕,该滤波器的截止频率能够自动搜索并且跟踪浊音的基频。〔4〕是对浊音基频的判断装置,然后,将浊音基频C触发一个锁相倍频器〔5〕,得到与浊音基频倍频的采样脉冲序列d(例如64倍频)。〔6〕是一个分频器,它为锁相回路提供反馈。语音电信号b同时又通过一个抗混叠滤波器〔7〕,然后用A/D转换器〔8〕进行同步采样,对于浊音,用其基频的倍频脉冲序列d以外触发的方式采样。对于清音,则仍以时钟脉冲采样。将语音电信号的采样序列以及基频的信息都送到计算机〔9〕中进行分析,提取特征并进行识别。图1中〔10〕是用调模板,〔11〕是音素和音节模板,模板都是预置的,计算机的输出e是对音素、音节的识别;f是对语调四声的识别,g是对说话人特征的识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/101985000000180/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top