[发明专利]语音基准登记方法无效
申请号: | 98810981.6 | 申请日: | 1998-08-17 |
公开(公告)号: | CN1278944A | 公开(公告)日: | 2001-01-03 |
发明(设计)人: | 小R·W·博斯梅尔 | 申请(专利权)人: | 阿美利泰克股份有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/06 |
代理公司: | 上海专利商标事务所 | 代理人: | 李家麟 |
地址: | 美国伊*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 基准 登记 方法 | ||
1.一种语音基准登记方法,其特征在于,它包含下述步骤:
(a)接收一单词的第一个发音;
(b)从第一个发音中获取多个特征;
(c)接收所述单词的第二个发音;
(d)从所述第二个发音中获取所述多个特征;
(e)确定从所述第一个发音获得的所述多个特征与从所述第二个发音获得的所述多个特征之间的第一个相似性;
(f)当所述第一个相似性小于一预定的相似性时,请用户说出所述单词的第三个发音;
(g)从所述第三个发音获得所述多个特征;
(h)确定从所述第一个发音的所述多个特征与从所述第三个发音的所述多个特征之间的第二个相似性;以及
(i)当所述第二个相似性大于或等于所述预定的相似性,形成所述单词的一个基准。
2.如权利要求1所述的方法,其特征在于,它还包含下述步骤:
(j)当所述第二个相似性小于所述预定的相似性时,确定从所述第二个发音获得的所述多个特征与从所述第三个发音获得的所述多个特征之间的相似性;
(k)当所述第三个相似性大于或等于所述预定相似性时,形成所述单词的所述基准。
3.如权利要求2所述的方法,其特征在于,它还包括下述步骤:
(1)当所述第三个相似性小于所述预定的相似性时,回到步骤(a)。
4.如权利要求1所述的方法,其特征在于,所述步骤(c)还包括下述步骤:
(c1)确定所述第二个发音的持续时间;
(c2)当所述持续时间小于一最小持续时间时,不考虑所述第二个发音。
5.如权利要求1所述的方法,其特征在于,所述步骤(c)还包括下述步骤:
(c1)确定所述第二个发音的持续时间;
(c2)当所述持续时间大于一最大持续时间时,不考虑所述第二个发音。
6.如权利要求5所述的方法,其特征在于,所述步骤(c1)还包括下述步骤:
(ⅰ)设定一幅度阈值;
(ⅱ)当一输入信号超过所述幅度阈值时,确定一起始时间;
(ⅲ)当所述输入信号小于所述幅度阈值时,在所述起始时间以后,确定一结束时间;
(ⅳ)计算所述结束时间和所述起始时间的差值,作为所述持续时间。
7.如权利要求1所述的方法,其特征在于,所述步骤(d)还包括下述步骤:
(d1)确定话音语音帧个数的估计;
(d2)当所述话音语音帧的所述个数的所述估计小于一阈值时,请用户重复所述单词;
(d3)回到步骤(c);
8.如权利要求1所述的方法,其特征在于,所述步骤(a)还包括下述步骤:
(a1)确定所述第一个发音的信噪比;
(a2)当所述信噪比小于一预定的信噪比时,增大一话音放大器的增益。
9.如权利要求8所述的方法,其特征在于,它还包括下述步骤:
(a3)请所述用户重复所述单词。
10.如权利要求1所述的方法,其特征在于,所述步骤(b)还包括下述步骤:
(b1)确定所述第一个发音的幅度直方图。
11.一种语音基准登记方法,其特征在于,它包含下述步骤:
(a)请用户说出一单词;
(b)检测一第一个发音;
(c)请所述用户说出所述单词;
(d)检测第二个发音;
(e)确定所述第一个发音与所述第二个发音之间的第一个相似性;
(f)当所述第一个相似性小于一预定的相似性时,请所述用户说出所述单词;
(d)检测第三个发音;
(h)检测所述第一个发音与所述第三个发音之间的第二个相似性;以及
(i)当所述第二个相似性大于或等于所述预定的相似性时,产生一基准。
12.如权利要求11所述的方法,其特征在于,它还包括下述步骤:
(j)确定所述第二个发音与所述第三个发音之间的第三个相似性;
(k)当所述第三个相似性大于或等于所述预定的相似性时,产生所述基准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿美利泰克股份有限公司,未经阿美利泰克股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/98810981.6/1.html,转载请声明来源钻瓜专利网。