[发明专利]一种基于语音辨识的移动终端的身份验证方法无效
申请号: | 200710066687.9 | 申请日: | 2007-01-12 |
公开(公告)号: | CN101222703A | 公开(公告)日: | 2008-07-16 |
发明(设计)人: | 薛全;严佳琦;吴亦平;王世杰 | 申请(专利权)人: | 杭州波导软件有限公司 |
主分类号: | H04Q7/32 | 分类号: | H04Q7/32;G10L17/00;G10L19/00;G10L15/00;H04Q7/38 |
代理公司: | 宁波诚源专利事务所有限公司 | 代理人: | 袁忠卫 |
地址: | 310013浙江省杭州市西溪路*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 辨识 移动 终端 身份验证 方法 | ||
技术领域
本发明涉及一种身份验证的方法,具体涉及一种基于语音辨识的移动终端的身份验证方法。
背景技术
手机(以及其他的移动终端设备)作为无线移动通信终端设备已经成为人们日常工作、学习和生活的重要组成部分,语音通话、短信、彩信、彩铃等基本手机功能已经得到了相当广泛的推广和使用。随着手机功能的逐渐强大和完善,目前基于有线网络的很多应用将逐渐的过渡到无线网络,中、高档手机将提供针对移动商务的各种服务,为移动通信带来新的更大的需求,同时也给手机的身份验证等安全性能提出了更高的要求。在商务活动中,必然要进行身份识别与验证,由于有意或者无心造成的手机身份错认产生的经济纠纷,必须尽可能的避免,为用户提供一个安全便捷的移动交易环境。而现有手机开发技术中,正缺乏能够进行身份有效识别的手段和方法。
中国科学院声学研究所和北京中科信利技术有限公司在公开号为CN1455389的专利(专利号为02148684.0)公开了一种语音识别系统及用于语音识别系统的特征矢量集的压缩方法,该种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量,本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。其缺陷在于:数据运算量仍然过大,而且识别过程仍然较为复杂,这样,如需在类似于手机这种硬件资源不够丰富的电子终端上应用这种识别方法,依然比较困难。
综合上述,基于语音辨识的移动终端的身份验证方法尚需要进一步改进。
发明内容
本发明所要解决的技术问题是提供一种基于语音辨识的移动终端的身份验证的方法,用以在通过移动终端进行商务活动之前实现对手机用户的身份识别与管理,并且该方法可靠性好,且容易实施。
本发明解决上述技术问题所采用的技术方案为:一种基于语音辨识的移动终端的身份验证方法,其特征在于步骤依次为:
(1)获取作为模板的参考音频样本,并将该参考音频样本进行音频参数化,生成参考矢量树,生成参考柱状图;
(2)获取当前的音频样本,并将该音频样本进行音频参数化,生成当前矢量树,生成当前柱状图;
(3)模板对比:根据距离计算方法计算参考柱状图和当前柱状图的距离;
(4)根据所得距离并且与预先设定的阈值进行比较取得最后的判断结论,如通过论证,使移动终端启动服务程序,没有通过论证,则退出返回,终止服务程序;
(5)结束。
所述的音频参数化其步骤依次为:(1)音频加权平均窗口化,将一系列连续的音频数据分成若干小段;(2)梅尔比例化过程,对于每一个窗口,通过离散傅立叶变换DFT计算能量谱,该频谱系数是由一个频率刻度的非线性图来加权的;(3)通过另一个离散傅立叶变换DFT把加权的梅尔频谱转换成对数倒频谱系数,将所述音频转化成多维的特征矢量。
所述的生成柱状图的方法为:通过统计所有被量化类数据的叶子的概率来获取类属性,并依据每一片叶子包含特征矢量数目的概率生成柱状图。
所述的作为模板的参考音频样本通过一个或多个样本的训练来获得参考音频的矢量树和柱状图,对于多个样本的情况,具体方法在于通过多个样本的融合,从而合成一个新的模板样本,使身份认证更加准确。
所述的音频参数化采用n+1维的特征矢量,即n维的MFCC加上能量,且n为10~20之间的整数,包括端点,便于计算和储存。
所述的距离计算是采用欧几里得距离计算方法或者是采用余弦距离计算方法来计算两个样本柱状图的距离。
所述的音频样本获取界面在移动终端上,并利用移动终端内已有的录音功能录下语音文件,减少了手机端开发的工作。
所述的语音文件通过移动终端的彩信功能将其发送到远端语音辨识服务器,进行处理和对比,对比结果返回到移动终端,这样仅需要在手机上增加一个语音录入的界面即可以实现手机端语音的输入输出,充分利用服务器处理速度快、储存量大优势,降低对移动终端硬件上的要求
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州波导软件有限公司,未经杭州波导软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710066687.9/2.html,转载请声明来源钻瓜专利网。