[发明专利]特定人群的个性化彩铃自动审核方法及系统在审
申请号: | 201410654825.5 | 申请日: | 2014-11-17 |
公开(公告)号: | CN104361891A | 公开(公告)日: | 2015-02-18 |
发明(设计)人: | 王瑞 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L17/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特定 人群 个性化 自动 审核 方法 系统 | ||
技术领域
本发明涉及音频信号处理技术领域,特别涉及一种特定人群的个性化彩铃自动审核方法及系统。
背景技术
个性化铃音是使用了智能语音技术、满足用户亲自动手、便捷制作个性内容的铃音、实现个人情感诉求的一项增值业务。个性化铃音业务提供了丰富多彩的铃音制作方式,可以通过特色的TTS(Text To Speech,从文本到语言)、预置铃音下载、录制、剪裁方式制作个性化铃音。
而用户制作的彩铃质量良莠不齐,部分用户为了满足自己所谓的个性,制作的彩铃中,往往会出现恶意使用名人或者敏感人群的声音制作彩铃,彩铃审核人员较难进行全面的判断。会导致恶意的彩铃流入市场,引起不必要的麻烦。
同时人工审核也受条件制约,不同的审核人员在不同的环境中,审核出的结论也不尽相同,随着业务量逐渐增加,彩铃企业也无法负担不断增长的审核业务人力成本,如图1所示,为目前人工审核彩铃的流程示意图。
发明内容
本发明旨在至少在一定程度上解决上述相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种特定人群的个性化彩铃自动审核方法,该方法能够自动、快速、准确地提取出不合格的彩铃,效率高、成本低。
本发明的另一个目的在于提供一种特定人群的个性化彩铃自动审核系统。
为达到上述目的,本发明第一方面的实施例提出了一种特定人群的个性化彩铃自动审核方法,包括以下步骤:接收待审核的彩铃;从所述彩铃中提取语音;提取所述语音的音频特征,根据所述音频特征判断所述语音对应的声音是否来自预设人群;以及如果是,则判断所述彩铃未通过审核,否则判断所述彩铃通过审核,并将通过审核的彩铃上传至服务器。
根据本发明实施例的特定人群的个性化彩铃自动审核方法,对待审核彩铃的频谱进行分析,提取出说话语音的音频特征,并判断该语音是否属于预设人群,如果是,则判定待审核的彩铃未通过审核,否则该彩铃通过审核,然后将审核通过的彩铃上传至服务器。因此,该方法能够快速、准确地提取出不合格(如包含预设人群的语音)的彩铃,效率高、成本低。
另外,根据本发明上述实施例的特定人群的个性化彩铃自动审核方法还可以具有如下附加的技术特征:
在本发明的一个实施例中,所述从所述彩铃中提取语音的步骤包括:利用音频分类器对所述彩铃进行频谱分析,以从所述彩铃中分离所述语音和铃音。
在本发明的一个实施例中,所述提取所述语音的音频特征,根据所述音频特征判断所述语音对应的声音是否来自预设人群,进一步包括:提取所述语音的音频特征;根据所述语音的音频特征和来自所述预设人群的语音的音频特征得到声纹相似度;如果所述声纹相似度大于预设阈值,则判断所述语音对应的声音来自所述预设人群。
在本发明的一个实施例中,所述音频特征包括MFCC特征。
在本发明的一个实施例中,在从所述彩铃中提取语音之前,还包括:对所述彩铃进行噪音过滤。
本发明第二方面的实施例还提供了一种特定人群的个性化彩铃自动审核系统,包括:上传方,用于上传所述待审核的彩铃;审核方,用于从所述待审核的彩铃中提取语音,并提取所述语音的音频特征,根据所述音频特征判断所述语音对应的声音是否来自预设人群,以及在判断所述语音对应的声音来自预设人群时,判断所述彩铃未通过审核,否则判断所述彩铃通过审核;彩铃服务器,用于接收并保存所述审核方审核通过的彩铃。
根据本发明实施例的特定人群的个性化彩铃自动审核系统,对待审核彩铃的频谱进行分析,提取出说话语音的音频特征,并判断该语音是否属于预设人群,如果是,则判定待审核的彩铃未通过审核,否则该彩铃通过审核,然后将审核通过的彩铃上传至服务器。因此,该系统能够快速、准确地提取出不合格(如包含预设人群的语音)的彩铃,效率高、成本低。
另外,根据本发明上述实施例的特定人群的个性化彩铃自动审核系统还可以具有如下附加的技术特征:
在本发明的一个实施例中,所述审核方利用音频分类器对所述彩铃进行频谱分析,以从所述彩铃中分离所述语音和铃音。
在本发明的一个实施例中,所述审核方提取所述语音的音频特征,根据所述音频特征判断所述语音对应的声音是否来自预设人群,进一步包括:提取所述语音的音频特征;根据所述语音的音频特征和来自所述预设人群的语音的音频特征得到声纹相似度;如果所述声纹相似度大于预设阈值,则判断所述语音对应的声音来自所述预设人群。
在本发明的一个实施例中,所述音频特征包括MFCC特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410654825.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制作铃音的方法及装置
- 下一篇:语音加密方法和装置以及语音解密方法和装置