[发明专利]一种基于声纹识别的来电身份识别系统及其识别方法有效
申请号: | 201310677837.5 | 申请日: | 2013-12-13 |
公开(公告)号: | CN103700371B | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 马世典;韩牟;赵宏杰;汪少华 | 申请(专利权)人: | 江苏大学 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/06 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 汪旭东 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 识别 来电 身份 系统 及其 方法 | ||
技术领域
本发明涉及声纹识别技术,即根据说话人的发音特征,自动识别说话人身份的一种生物识别方法。
背景技术
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。
声纹识别的一般过程:
(1)从待识别人的声音中提取声学特征形成待识别的特征矢量序列;
(2)将待识别的特征矢量序列与该模型库中的声纹模型逐一进行匹配比较得到特征矢量序列与每个说话人声纹模型的匹配得分(也称为对数似然的分,或似然得分,或得分),并进行判决;计算特征矢量序列与说话人模型匹配分数;
(3)根据声纹的识别方法的类型(闭集声纹鉴别、开集声纹鉴别和声纹确认),在需要的时候进行拒识判决,从而得出结果。
声纹识别可以说有两个关键问题,一是特征提取,二是模式匹配(模式识别)。特征提取的任务是提取并选择声音片段中具有可分性强、稳定性高等特性的声学或语言特征。与语音识别不同,声纹识别的特征必须是“个性化”特征,而说话人识别的特征对说话者本人来讲必须是“共性特征”。
现有的语音识别装置当通信设备中存储联系人换了号码或用未知电话给机主通话时,机主不能及时判断通话人的身份。
发明内容
针对现有技术中语音识别存在的识别率不高的问题,本发明提供一种基于声纹识别的来电身份识别系统及其识别方法,在通信设备中植入声纹识别模块用来判别联系人身份。
本发明的技术方案如下:
一种基于声纹识别的来电身份识别系统,包括声纹获取单元、声纹处理器单元、声纹数据存储单元、声纹识别单元;所述声纹获取单元、声纹数据存储单元、声纹识别单元分别与声纹处理器单元相连,声纹获取单元向声纹处理器单元单向通信,声纹识别单元向声纹处理器单元单向通信,声纹数据存储单元和声纹处理器单元相互通信,声纹识别单元向声纹数据存储单元单向通信。
一种基于声纹识别的来电身份识别系统的识别方法,包括如下步骤:
(1)声纹特征提取:
当有未知声纹源进入声纹获取单元后,自动触发保存提示功能,提示使用者保存该声纹数据以便下一次通话时自动识别该联系人;使用者确认保存该声纹数据后,声纹处理器单元将形成由所有联系人的声纹模型构成的声纹模型库,所述声纹模型是从联系人的声音中提取声学特征构建而成,声纹模型中的声学特征和身份信息相互关联绑定在一起;
(2)声纹特征通讯录的存储:
将所述声纹模型库存储于声纹数据存储单元中,所述声纹数据存储单元设置于手机内存中,或者设置于外部存储卡中;
(3)模式识别:
当已保存的联系人来电时,声纹识别单元提取来电者的声学特征形成待识别的特征矢量序列并通过模式匹配来判别联系人身份;当新联系人与机主通话时,声纹识别单元无法识别,但仍提取来电人的声学特征,通话结束后自动提醒机主是否将来电者存为新联系人。
进一步,所述提取声学特征构和存储声纹特征的具体过程为:
(1)当来电通话开始时,启动声纹获取模块,获取来电者的声音片段并存储;
(2)通过分析声音片段提取来电者的声学特征;
(3)模式匹配,将已获得的声纹特征与声纹模型库中已存储的声纹模型进行比对;
(4)判定,将得分与预先设定的得分判定阈值进行比较;
(5)输出,当匹配成功后,输出匹配结果,即识别到的联系人相关信息;当匹配不成功时,通话结束后输出提示信息提示用户存储该声纹信息以及相关电话号码姓名信息,以便下次通话时实时识别;
(6)存储,当通话结束后,使用者采纳提示建议,系统将该声纹信息及其相关身份信息存入存储单元,并加入声纹模型库;反之,不存储。
进一步,步骤(1)中,声纹获取单元获取来电者通话的一段声音片段,存入声纹数据存储单元中分配的一块临时存储区中,以备对其进行声学特征分析;当分析结束后,声纹特征被保留,其余被声音数据自动删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310677837.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自测温光纤复合耐火电缆
- 下一篇:燕尾槽的车削装置