[发明专利]语音辨认所有语言及用语音输入单字的方法无效
申请号: | 200910177107.2 | 申请日: | 2009-09-25 |
公开(公告)号: | CN102034474A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 | 申请(专利权)人: | 黎自奋;李台珍;黎世聪;黎世宏;廖丽娟 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G06F3/16 |
代理公司: | 北京乾诚五洲知识产权代理有限责任公司 11042 | 代理人: | 付晓青;杨玉荣 |
地址: | 中国台湾台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种语音辨认所有语言及用语音输入单字的方法,本发明先用一群m个未知或已知不同单音代表m个不同类,将常用单字发音一次,每个单字的发音转换成一个线性预估编码倒频谱矩阵,再用贝氏或距离分类法将常用字分到m类中的一类,使用者发单字音后,用贝氏或距离分类法在m个未知单音找F个最相似的未知单音,再在F个相似的未知单音所代表的F个类内,将所有单字依和所要单字发音的相似度及字母(或笔划数)排列;当使用者发音后,很快能找到所要的字。本发明的方法简单、不需样本、不需注音、不需打字、任何人都可胜任、发音不标准或发错音的字也可输入、速度快、准确率高。 | ||
搜索关键词: | 语音 辨认 所有 语言 用语 输入 单字 方法 | ||
【主权项】:
一种语音辨认所有语言及用语音输入单字的方法,其特征在于,所述方法包括以下步骤:(1)一个单字是英文、中文或其它文字,一个单字的发音为单音,本方法具有m个未知或已知单音及一个常用单字资料库,每个未知单音有样本;(2)一个先前处理器删去不具语音音波的信号点或杂音;(3)一种单音音波正常化及抽取特征的方法,是用E个弹性框将音波正常化,并转换成大小相等的线性预估编码倒频谱E×P特征的矩阵;(4)求每个未知单音线性预估编码倒频谱样本的平均值及变异数,一个E×P样本的平均值及变异数矩阵代表一个未知单音,每个未知单音代表一类有相似音的常用字,一共有m类;(5)一个发音清晰标准的发音人,对每一常用单字发音一次,如使用者发音不准,或用其它方言及语言发音,则由使用者发音;(6)每一常用单字发音的音波正常化及抽取特征的方法,是将音波正常化并转换成一个E×P线性预估编码倒频谱的矩阵;(7)一种简化贝氏分类法,是比较一个常用单字的E×P线性预估编码倒频谱的矩阵及每个未知单音的E×P样本的平均值及变异数矩阵,用贝氏距离找和该常用字的发音最相似的未知单音,再将该常用单字放在该最相似的未知单音所代表的类的常用字中;(8)使用者对所要的单字发音,该单音转换成一个E×P的线性预估编码倒频谱的矩阵;(9)用简化贝氏分类法比较使用者所要单字的E×P线性预估编码倒频谱的矩阵及每个未知单音的E×P样本的平均值及变异数矩阵,用贝氏距离找和所要单字发音最相似的F个未知单音;(10)在最相似的F个未知单音所代表的F个类的常用字中,求所有常用字的E×P线性预估编码倒频谱的矩阵和所要单字的E×P线性预估编码倒频谱的矩阵之间的距离来排列F类所有的常用字,排列后,使用者所要的单字应当排在最前面,或排列后,所有的常用字分成数等段,每等段常用字以字母或笔划数排列,F类所有常用字依和所要单字发音的距离及常用字的字母或笔划数排列成一个矩阵,使用者发音后,依所要单字的字母或笔划数在该F类所有常用字的矩阵中由上向下找,很容易在矩阵中找到所要单字;(11)一种辨认句子及名称的方法;(12)一种修正辨认不成功的单字及句子及名称、及输入不成功的单字、及加入新单字的方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黎自奋;李台珍;黎世聪;黎世宏;廖丽娟,未经黎自奋;李台珍;黎世聪;黎世宏;廖丽娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910177107.2/,转载请声明来源钻瓜专利网。
- 上一篇:带太阳能电板的落地灯
- 下一篇:背光模块以及液晶显示装置