[发明专利]可辨认任何语言句子的方法无效
申请号: | 201010563452.2 | 申请日: | 2010-11-29 |
公开(公告)号: | CN102479507A | 公开(公告)日: | 2012-05-30 |
发明(设计)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 | 申请(专利权)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/08;G10L15/28 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 11139 | 代理人: | 孙皓晨 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辨认 任何 语言 句子 方法 | ||
技术领域
本发明提供一种可辨认任何语言句子的方法,用12弹性框(窗),等长、无滤波器、不重叠,将一到多个单字组成长短不一的一个句子的音波转换成E×P=12×12的线性预估编码倒频谱(LPCC)的矩阵。将全部被辨认的已知句子以相似度先分到一千个不同资料库中,辨认一个未知句子时,将它先转换成E×P线性预估编码倒频谱矩阵,再用未知句子E×P矩阵用距离从一千个资料库中,找最接近的资料库。再从最接近的资料库内的已知句子,用距离找要辨认未知的句子。
当使用者发音后,用Visual Basic,不到一秒钟很快能辨认所要的句子。方法简单,不需样本,任何人都可即时使用,发音不标准或发错音者也可。以前要计算及比对一个句子特征值,本发明只要计算及比对一个句子E×P矩阵值,速度快、准确率高。用普通话、闽南语、英语、日语、德语发音均测试过,可辨认大量语音,本发明不用样本,用简单数学计算及辨认,又准又快。
背景技术
一般辨认一个未知句子是先将该未知句子切割成多个单音或单字,切割是一项极高难度技术,尤其是英语,一个英语单字有多个音节,很难切割准确,一音节之差会使未知句子辨认错。所以讲话时,要小心、要慢、要清楚、单字间隔要长。再将未知句子全部单字和资料库的已知单字比对,一个单字错误会使未知句子辨认错。再将单字资料库找到的已知单字依照未知句子单字顺序,连成一个已知句子,再从句子资料库找最可能已知句子为未知句子。一般辨认一个未知句子方法很难准确,费时,不能正常和电脑自由交谈。一般辨认方法需费时做样本,须用统计计算及辨认,当然不准,因统计只能估计。
一个句子的发音是用音波表示。音波是一种随时间作非线性变化的系统,一个句子音波内含有一种动态特性,也随时间作非线性连续变化。相同句子发音时,有一连串相同动态特性,随时间作非线性伸展及收缩,但相同动态特性依时间排列秩序一样,但时间不同。相同句子发音时,将相同的动态特性排列在同一时间位置上非常困难。
一个电脑化语言辨认系统,首先要抽取声波有关语言资讯,也即动态特性,过滤和语言无关的杂音,如人的音色、音调,说话时心理、生理及情绪和语音辨认无关先删去,然后再将相同句子的相同特征排列在相同的时间位置上。此一连串的特征用一等长系列特征向量表示,称为一个句子的特征模型。目前语音辨认系统要产生大小一致的特征模型太复杂,且费时,因为相同句子的相同特征很难排列在同一时间位置上,尤其是英语,导致比对辨认较困难。
一个连续声波特征常用有下列几种:能量(energy),零横过点数(zerocrossings),极值数目(extreme count),颠峰(formants),线性预估编码倒频谱(LPCC)及梅尔频率倒频谱(MFCC),其中以线性预估编码倒频谱(LPCC)及梅尔频率倒频谱(MFCC)是最有效,并普遍使用。线性预估编码倒频谱(LPCC)是代表一个连续音最可靠,稳定又准确的语言特征。它用线性回归模式代表连续音音波,以最小平方估计法计算回归系数,其估计值再转换成倒频谱,就成为线性预估编码倒频谱(LPCC)。而梅尔频率倒频谱(MFCC)是将音波用傅氏转换法转换成频率。再根据梅尔频率比例去估计听觉系统。根据学者S.B.Davis and P.Mermelstein于1980年出版在IEEE Transactions on Acoustics,Speech Signal Processing,Vol.28,No.4发表的论文Comparison of parametric representations for monosyllabicword recognition in continuously spoken sentences中用动态时间扭曲法(DTW),梅尔频率倒频谱(MFCC)特征比线性预估编码倒频谱(LPCC)特征辨认率要高。但经过多次语音辨认实验(包含本人前发明),用贝氏分类法,线性预估编码倒频谱(LPCC)特征辨认率比梅尔频率倒频谱(MFCC)特征要高,且省时。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;黎世聪;黎世宏;廖丽娟,未经黎自奋;李台珍;黎世聪;黎世宏;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010563452.2/2.html,转载请声明来源钻瓜专利网。