[发明专利]可辨认任何语言句子的方法无效

专利信息
申请号: 201010563452.2 申请日: 2010-11-29
公开(公告)号: CN102479507A 公开(公告)日: 2012-05-30
发明(设计)人: 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 申请(专利权)人: 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟
主分类号: G10L13/08 分类号: G10L13/08;G10L15/08;G10L15/28
代理公司: 北京科龙寰宇知识产权代理有限责任公司 11139 代理人: 孙皓晨
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 辨认 任何 语言 句子 方法
【权利要求书】:

1.一种可辨认所有语言句子的方法,其特征在于,其步骤包含:

(1)一个句子可能是任何语言一个单音,单字,名称或句子,先有M=1000个不同声音;

(2)一个先前处理器删去在句子或声音之前及句子或声音之后,两单字之间及两音节之间,所有不具语音音波信号点的静音及杂音;

(3)一个声音或句子音波正常化及抽取特征方法:用E个相等弹性框,没有滤波器,不重叠,将一个声音或句子音波正常化,并转换成大小相等的线性预估编码倒频谱E×P矩阵;

(4)M=1000不同声音的线性预估编码倒频谱E×P矩阵代表M=1000不同资料库;

(5)使用者对已知句子清楚发音一次,删去在句子之前及句子之后,两单字及两音节之间,所有不具语音音波信号点的静音及杂音,用E个相等弹性框将一个已知句子具语音的音波正常化,并转换成大小相等的线性预估编码倒频谱E×P矩阵;

(6)用已知句子线性预估编码倒频谱E×P矩阵与所有M=1000不同声音的线性预估编码倒频谱E×P矩阵之间距离或加权距离找最接近的资料库,将该已知句子的线性预估编码倒频谱E×P矩阵分到最接近的资料库内,同样,再用距离或加权距离,将全部要辨认的任何语言已知句子的线性预估编码倒频谱E×P矩阵分到和代表资料库声音的线性预估编码倒频谱E×P矩阵距离最近的资料库内,相似已知句子都放在同一资料库内;

(7)要辨认未知句子时,使用者对所要未知句子发音后,同样用该未知句子线性预估编码倒频谱E×P矩阵与所有M=1000不同声音的线性预估编码倒频谱E×P矩阵之间的距离或加权距离找F个最接近的资料库,再用该未知句子线性预估编码倒频谱E×P矩阵与F个最接近的资料库内”相似已知句子”的线性预估编码倒频谱E×P矩阵之间的距离或加权距离,找使用者所要的未知句子;

(8)如果辨认不成功,使用者再发音该句子一次,用E个相等弹性框将该句子转换成线性预估编码倒频谱E×P矩阵,将该句子及出现最前面N个句子线性预估编码倒频谱的(N+1)个E×P平均值矩阵作为该句子的E×P特征矩阵,用距离将该句子的E×P特征矩阵,该E×P特征矩阵即为平均值矩阵,分到最接近的资料库内,再辨认该句子。

2.根据权利要求1所述的可辨认所有语言句子的方法,其特征在于,步骤(3)包含用E个相等弹性框,等长,没有滤波器,不重叠,将一个声音或句子音波正常化及抽取大小一致的特征矩阵,步骤如下:

删去在句子或声音之前及句子或声音之后,两单字之间及两音节之间,所有不具语音音波信号点的静音及杂音,用一个均等分一个句子或一个声音所有有声音波信号点方法,为了用线性变化的回归模式密切估计非线性变化的音波,将全长有声音波信号点分成E=12相等时段,每相等时段形成一个弹性框,一个句子或一个声音共有E个”等长”弹性框,没有滤波器,不重叠,可以自由伸缩含盖全长音波,不是固定长度的汉明窗;

每个”等长”弹性框内,用一随时间作线性变化的回归模式估计随时间作非线性变化的音波;

信号点S(n)可由前面信号点估计,其估计值S′(n)由下列回归模式表示:

S(n)=Σk=1PakS(n-k),n0]]>

在上式中,ak,k=1,...,P,是回归未知系数估计值,P是前面信号点数目,以E1表示信号点S(n)及其估计值S′(n)之间平方差总和:

E1=Σn=0N[S(n)-Σk=1PakS(n-k)]2]]>

求回归系数使平方总和E1达最小。对每个未知回归系数ai,i=1,...,P,求上式的偏微分,并使偏微分为0,得到P组正常方程式:

Σk=1PakΣnS(n-k)S(n-i)=ΣnS(n)S(n-i),]]>1≤i≤P

由上两式,得最小总平方差EP

EP=ΣnS2(n)-Σk=1PakΣnS(n)S(n-k)]]>

由上两式转换为

Σk=1PakR(i-k)=R(i),]]>1≤i≤P

EP=R(0)-Σk=1PakR(k)]]>

用N表示框内信号点数,在上两式中

R(i)=Σn=0N-iS(n)S(n+i),i0]]>

用Durbin的循环快速计算线性预估编码向量如下:

E0=R(0)

ki=[R(i)-Σj=1i-1aj(i-1)R(i-j)]/Ei-1]]>

ai(i)=ki]]>

aj(i)=aj(i-1)-kiai-j(i-1),]]>1≤j≤i-1

Ei=(1-ki2)Ei-1]]>

用上五公式循环计算,得到回归系数最小平方估计值aj,j=1,...,P,即线性预估编码向量如下:

aj=aj(P)]]>1≤j≤P

再用下列两公式

ai=ai+Σj=1i-1(ji)ai-jaj,]]>1≤i≤P

ai=Σj=i-Pi-1(ji)ai-jaj,]]>P<i

将线性预估编码向量转换较稳定线性预估编码倒频谱向量a′j,j=1,...,P;

用一个线性预估编码倒频谱E×P矩阵,表示一个句子或一个声音。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;黎世聪;黎世宏;廖丽娟,未经黎自奋;李台珍;黎世聪;黎世宏;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010563452.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top