[发明专利]字符内容提示的声纹识别方法无效
申请号: | 201010221624.8 | 申请日: | 2010-07-08 |
公开(公告)号: | CN102314877A | 公开(公告)日: | 2012-01-11 |
发明(设计)人: | 黄伟;蔡洪滨;李轶杰 | 申请(专利权)人: | 盛乐信息技术(上海)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 上海浦一知识产权代理有限公司 31211 | 代理人: | 孙大为 |
地址: | 201203 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 内容 提示 声纹 识别 方法 | ||
技术领域
本发明涉及一种智能识别方法,具体涉及一种声纹识别方法。
背景技术
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。
人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。
声纹识别的应用有一些缺点,比如同一个人的声音具有易变性,易受身体状况、年龄、情绪等的影响;比如不同的麦克风和信道对识别性能有影响;比如环境噪音对识别有干扰;又比如混合说话人的情形下人的声纹特征不易提取;……等等。尽管如此,与其他生物特征相比,声纹识别的应用有一些特殊的优势:(1)蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高;(2)获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备;(3)适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路(通讯网络或互联网络)实现远程登录;(4)声纹辨认和确认的算法复杂度低;(5)配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率;……等等。这些优势使得声纹识别的应用越来越受到方法开发者和用户青睐,声纹识别的世界市场占有率15.8%,仅次于手指和手的生物特征识别,并有不断上升的趋势。
声纹识别有文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种。与文本有关的声纹识别方法要求用户按照规定的内容发音,每个人的声纹模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果,但方法需要用户配合,如果用户的发音与规定的内容不符合,则无法正确识别该用户。
目前常用的与文本相关的声纹识别其文本往往采用随机数字串的形式。在随机数字串的声纹认证方法中,同时提供一个8位的数字串提示,容易导致用户连读,连读现象若严重,会严重影响方法的性能。采用冒泡型的字符提示可以防止连读,使其变成孤立词的语音识别和声纹识别。同时,这种提示方式更为生动形象,易为用户接受。
发明内容
本发明所要解决的技术问题是提供一种字符内容提示的声纹识别方法,它可以解决字符连读对语音识别和声纹认证的性能影响。
为了解决以上技术问题,本发明提供了一种字符内容提示的声纹识别方法,包括以下步骤:步骤一、通过随机种子产生一个长度为N的随机字符串,N为≥2的正整数;步骤二、每次显示一个字符,检测是否已完成单个字符的录音,如果已完成单个字符的录音再弹出下一个字符,直至最后一个字符被录音;步骤三、完成整个字符串的录音后,进行声纹验证。
本发明的有益效果在于:通过实时的静音检测算法,采取一种冒泡式的字符串提示,使得连续字符串可视为一串孤立的字符,解决了字符连读对语音识别和声纹认证的性能影响。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1是本发明实施例所述方法的流程图;
图2是本发明实施例所述智能字符内容提示示意图;
图3是本发明实施例所述声纹识别示意图。
具体实施方式
本发明设计了一种字符内容提示的声纹识别方法,可提升后端语音识别和声纹认证方法的性能。本发明所述的字符可以为字母或数字或符号,只要是字符即可。其优选的使用单音节的字符,其中更优选的是采用数字作为本发明所述的字符。以下以数字为例介绍本发明的具体实施例,但本发明不限于数字作为字符内容提示使用。
如图1所示,本发明首先通过随机种子产生一个8位的随机数字串,每次提供一个数字,用户录音过程中,通过实时的静音检测程序检测到用户已完成单个数字的录音,再弹出下一个数字,直至最后一个数字。完成整个数字串的录音后,再继续后端的语音识别和声纹识别模块。
本发明通过实时的静音检测算法,采取一种冒泡式的数字串提示,使得连续数字串可视为一串孤立的数字,解决了数字连读对语音识别和声纹认证的性能影响。
本发明通过一种更为生动形象的交互方式,使得整个方法更易被用户接受和使用。
前端的数字串提示主要步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛乐信息技术(上海)有限公司,未经盛乐信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010221624.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于汽车电线束单板装配作业的工装台
- 下一篇:电熔耐材柱式升降旋转浇注车
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法