[发明专利]公共背景噪声下激活式的声纹密码安全控制方法及系统在审

专利信息
申请号: 201710285878.8 申请日: 2017-04-27
公开(公告)号: CN107172018A 公开(公告)日: 2017-09-15
发明(设计)人: 金亚强;殷瑞祥 申请(专利权)人: 华南理工大学
主分类号: H04L29/06 分类号: H04L29/06;G10L21/0208;G10L25/45
代理公司: 广州市华学知识产权代理有限公司44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 公共 背景 噪声 激活 声纹 密码 安全 控制 方法 系统
【说明书】:

技术领域

发明涉及智能家居的人机交互技术领域,尤其涉及一种公共背景噪声下激活式的声纹密码安全控制方法及系统。

背景技术

随着社会的发展,语音作为一种媒介出现在人机交互界面中,是社会发展的趋势,相比其它任何一种人与人之间的交流方式来说,语音交流是一种快速的手段,语音识别已经慢慢渗透于我们日常生活当中,现在很多行业先驱相信借于语音进行人机之间的交互,会引向一个方便人们日常生活。

自动语音识别(Automatic Speech Recognition,ASR)技术自从二十世纪五十年代以来一直研究的主题。自动语音识别技术是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,语音识别系统在人机交互领域的应用还不是很成熟,只有在特定的条件下获得满意的性能,或者说只能应用于特定的某些场合。

在智能家居给人们带来便捷生活的同时,人们的控制习惯渐渐发生了改变。语音技术的发展也为控制入口做出了一个很好的补充,再抛去传统遥控器和手机APP之后,通过语音指令的发送让人们的生活更加便利。所谓智能语音主要是通过语音识别技术和语音合成技术为用户提供各种服务。在语音控制技术方面,人们与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。试音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。

就目前语音识别的发展状况,语音识别技术分为很多种模式,比如说按系统的用户情况分为特定人和非特定人识别系统,按系统的词汇量分为小词汇量、中词汇量和大词汇量系统,按语音的输入方式分为孤立词、连接词和连续语音系统等,按输入语音的发音方式分朗读式、口语式,按输入语音的方言背景情况分为普通话、方言背景普通话、方言语音识别系统,按输入语言的情感状态分为中性语音、情感语音识别系统等等。但在高识别率的情况下只有通过特定的条件下才能实现。

现在设备的人机交互界面有键盘、图像、指纹等方式,但是键盘操作有很多不方便。在特定环境下,比如汽车驾驶人员在驾驶的时候操作键盘要手眼并用,就无法注意到路面状况,这就存在着交通隐患。对于某些身体残疾或老人来说,界面式的操作都不是很方便,甚至是不可能的。

通信以及网络的全球覆盖使得信息公开化成为历史必然,人们获取资料的手段前所未有的丰富,然而负面影响也随之而来。伴随着信息透明化,个人隐私的安全性也受到了极大的威胁,相应的,如何正确进行个人身份的识别进而保护私人数据,是人机交互中一个亟待深入的课题。在个人身份识别中,传统的文字密码等保密手段存在着易被窃取和冒认的危险,而利用人本身的生物特征是相对比较可靠的一门技术。许多生物特征往往具有唯一性,如DNA、虹膜、指纹等等,这些特征不会改变;另一方面就是声音在一定的时间间隔内相对稳定的特征。上述两方面都可以作为识别的依据。声纹密码识别相对于指纹、虹膜识别来说,人声的采集成本低廉、操作简便,具有很好的通用性和独特性;同时声音带有较强的个人特征,可以广泛地普及到人们的日常生活领域中。

对于现状的智能家居的语音控制在很多场景下因语音交互体验不如人意而深受诟病,究其主要原因是受限于空间距离、背景噪声、其他人声的干扰、回声、混响等多重复杂因素,进而出现识别距离近、识别率低、安全性能低的明显缺点。现在大部分智能家居系统中的语音控制只是做到简单的控制,忽略了其功效和安全性。

所以说在人机交互中的自然语言交互的公共背景噪声下声音拾取和安全性是两个亟待深入研究的两个课题。

发明内容

为了克服现有技术存在的缺点与不足,本发明提供一直公共背景噪声下激活式的声纹密码安全控制方法及系统,解决了背景噪声,其他人声、回声、混响低信噪比下对语音突发的增量进行定位拾取,通过三次安全语音识别及控制的操作解决上述现状的问题。

为解决上述技术问题,本发明提供如下技术方案:一种公共背景噪声下激活式的声纹密码安全控制方法,包括下述步骤:

S1、激活识别模块在普通环境下实时进行语音信号监测,若检测到语音信号,则对语音信号进行预加重、加窗和分帧处理,并求取语音信号的幅度值;根据实验得到语音信号与噪声之间的信噪比,并将信噪比转化为幅度差T;设T为判决门限值,若语音信号的前一帧与后一帧只差大于等于T,则认为进入静默期;若语音信号的前一帧与后一帧只差小于T,则判断是激活标志,并激活声源定位拾取模块;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710285878.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top