[发明专利]可辨认任何语言句子的方法无效
申请号: | 201010563452.2 | 申请日: | 2010-11-29 |
公开(公告)号: | CN102479507A | 公开(公告)日: | 2012-05-30 |
发明(设计)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 | 申请(专利权)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/08;G10L15/28 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 11139 | 代理人: | 孙皓晨 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明可辨认任何语言的句子。一个句子可能是一个单字,名称或句子。本发明最重要的特点是将任何语言的句子“全部用相等的E×P=12×12矩”表示。先用一千个不同声音。用E=12等长弹性框,无滤波器,不重叠,将声音换成E×P线性预估编码倒频谱矩阵,代表一千个资料库。将要辨认已知句子除去两音节、两单字之间及句子前后两端的静音及杂音。再用E个等长弹性框转换成E×P线性预估编码倒频谱矩阵,用距离将该已知全部句子E×P矩阵,分到最近的资料库内。辨认一个未知句子时,将它转换成E×P线性预估编码倒频谱矩阵,再用未知句子E×P矩阵从一千个资料库中,找F个最接近的资料库,再从F个最接近的资料库内已知句子,找该未知句子。 | ||
搜索关键词: | 辨认 任何 语言 句子 方法 | ||
【主权项】:
一种可辨认所有语言句子的方法,其特征在于,其步骤包含:(1)一个句子可能是任何语言一个单音,单字,名称或句子,先有M=1000个不同声音;(2)一个先前处理器删去在句子或声音之前及句子或声音之后,两单字之间及两音节之间,所有不具语音音波信号点的静音及杂音;(3)一个声音或句子音波正常化及抽取特征方法:用E个相等弹性框,没有滤波器,不重叠,将一个声音或句子音波正常化,并转换成大小相等的线性预估编码倒频谱E×P矩阵;(4)M=1000不同声音的线性预估编码倒频谱E×P矩阵代表M=1000不同资料库;(5)使用者对已知句子清楚发音一次,删去在句子之前及句子之后,两单字及两音节之间,所有不具语音音波信号点的静音及杂音,用E个相等弹性框将一个已知句子具语音的音波正常化,并转换成大小相等的线性预估编码倒频谱E×P矩阵;(6)用已知句子线性预估编码倒频谱E×P矩阵与所有M=1000不同声音的线性预估编码倒频谱E×P矩阵之间距离或加权距离找最接近的资料库,将该已知句子的线性预估编码倒频谱E×P矩阵分到最接近的资料库内,同样,再用距离或加权距离,将全部要辨认的任何语言已知句子的线性预估编码倒频谱E×P矩阵分到和代表资料库声音的线性预估编码倒频谱E×P矩阵距离最近的资料库内,相似已知句子都放在同一资料库内;(7)要辨认未知句子时,使用者对所要未知句子发音后,同样用该未知句子线性预估编码倒频谱E×P矩阵与所有M=1000不同声音的线性预估编码倒频谱E×P矩阵之间的距离或加权距离找F个最接近的资料库,再用该未知句子线性预估编码倒频谱E×P矩阵与F个最接近的资料库内”相似已知句子”的线性预估编码倒频谱E×P矩阵之间的距离或加权距离,找使用者所要的未知句子;(8)如果辨认不成功,使用者再发音该句子一次,用E个相等弹性框将该句子转换成线性预估编码倒频谱E×P矩阵,将该句子及出现最前面N个句子线性预估编码倒频谱的(N+1)个E×P平均值矩阵作为该句子的E×P 特征矩阵,用距离将该句子的E×P特征矩阵,该E×P特征矩阵即为平均值矩阵,分到最接近的资料库内,再辨认该句子。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;黎世聪;黎世宏;廖丽娟,未经黎自奋;李台珍;黎世聪;黎世宏;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010563452.2/,转载请声明来源钻瓜专利网。