[发明专利]可辨认任何语言句子的方法无效

专利信息
申请号: 201010563452.2 申请日: 2010-11-29
公开(公告)号: CN102479507A 公开(公告)日: 2012-05-30
发明(设计)人: 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 申请(专利权)人: 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟
主分类号: G10L13/08 分类号: G10L13/08;G10L15/08;G10L15/28
代理公司: 北京科龙寰宇知识产权代理有限责任公司 11139 代理人: 孙皓晨
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 辨认 任何 语言 句子 方法
【说明书】:

技术领域

发明提供一种可辨认任何语言句子的方法,用12弹性框(窗),等长、无滤波器、不重叠,将一到多个单字组成长短不一的一个句子的音波转换成E×P=12×12的线性预估编码倒频谱(LPCC)的矩阵。将全部被辨认的已知句子以相似度先分到一千个不同资料库中,辨认一个未知句子时,将它先转换成E×P线性预估编码倒频谱矩阵,再用未知句子E×P矩阵用距离从一千个资料库中,找最接近的资料库。再从最接近的资料库内的已知句子,用距离找要辨认未知的句子。

当使用者发音后,用Visual Basic,不到一秒钟很快能辨认所要的句子。方法简单,不需样本,任何人都可即时使用,发音不标准或发错音者也可。以前要计算及比对一个句子特征值,本发明只要计算及比对一个句子E×P矩阵值,速度快、准确率高。用普通话、闽南语、英语、日语、德语发音均测试过,可辨认大量语音,本发明不用样本,用简单数学计算及辨认,又准又快。

背景技术

一般辨认一个未知句子是先将该未知句子切割成多个单音或单字,切割是一项极高难度技术,尤其是英语,一个英语单字有多个音节,很难切割准确,一音节之差会使未知句子辨认错。所以讲话时,要小心、要慢、要清楚、单字间隔要长。再将未知句子全部单字和资料库的已知单字比对,一个单字错误会使未知句子辨认错。再将单字资料库找到的已知单字依照未知句子单字顺序,连成一个已知句子,再从句子资料库找最可能已知句子为未知句子。一般辨认一个未知句子方法很难准确,费时,不能正常和电脑自由交谈。一般辨认方法需费时做样本,须用统计计算及辨认,当然不准,因统计只能估计。

一个句子的发音是用音波表示。音波是一种随时间作非线性变化的系统,一个句子音波内含有一种动态特性,也随时间作非线性连续变化。相同句子发音时,有一连串相同动态特性,随时间作非线性伸展及收缩,但相同动态特性依时间排列秩序一样,但时间不同。相同句子发音时,将相同的动态特性排列在同一时间位置上非常困难。

一个电脑化语言辨认系统,首先要抽取声波有关语言资讯,也即动态特性,过滤和语言无关的杂音,如人的音色、音调,说话时心理、生理及情绪和语音辨认无关先删去,然后再将相同句子的相同特征排列在相同的时间位置上。此一连串的特征用一等长系列特征向量表示,称为一个句子的特征模型。目前语音辨认系统要产生大小一致的特征模型太复杂,且费时,因为相同句子的相同特征很难排列在同一时间位置上,尤其是英语,导致比对辨认较困难。

一个连续声波特征常用有下列几种:能量(energy),零横过点数(zerocrossings),极值数目(extreme count),颠峰(formants),线性预估编码倒频谱(LPCC)及梅尔频率倒频谱(MFCC),其中以线性预估编码倒频谱(LPCC)及梅尔频率倒频谱(MFCC)是最有效,并普遍使用。线性预估编码倒频谱(LPCC)是代表一个连续音最可靠,稳定又准确的语言特征。它用线性回归模式代表连续音音波,以最小平方估计法计算回归系数,其估计值再转换成倒频谱,就成为线性预估编码倒频谱(LPCC)。而梅尔频率倒频谱(MFCC)是将音波用傅氏转换法转换成频率。再根据梅尔频率比例去估计听觉系统。根据学者S.B.Davis and P.Mermelstein于1980年出版在IEEE Transactions on Acoustics,Speech Signal Processing,Vol.28,No.4发表的论文Comparison of parametric representations for monosyllabicword recognition in continuously spoken sentences中用动态时间扭曲法(DTW),梅尔频率倒频谱(MFCC)特征比线性预估编码倒频谱(LPCC)特征辨认率要高。但经过多次语音辨认实验(包含本人前发明),用贝氏分类法,线性预估编码倒频谱(LPCC)特征辨认率比梅尔频率倒频谱(MFCC)特征要高,且省时。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;黎世聪;黎世宏;廖丽娟,未经黎自奋;李台珍;黎世聪;黎世宏;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010563452.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top