[发明专利]一种面向语音转换的主动式取证方法在审
申请号: | 202211686243.6 | 申请日: | 2022-12-27 |
公开(公告)号: | CN116013323A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈艳姣;徐文渊;钟奕楠;邓江毅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/08 | 分类号: | G10L17/08;G10L17/02 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 杨艳颖 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 语音 转换 主动 取证 方法 | ||
本发明公开了一种面向语音转换的主动式取证方法,涉及人工智能与计算机安全技术领域。包括:构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的取证模型;将目标说话人音频、音频文件集输入优化完成的取证模型,若得到的语音转换声纹损失值小于预设阈值,则完成主动取证。本发明实现了在说话人的语音数据上添加特定的噪声,可以帮助执法人员及相关部门确定语音转换的原始说话人。
技术领域
本发明涉及人工智能与计算机安全技术领域,更具体的说是涉及一种面向语音转换的主动式取证方法。
背景技术
当今,随着人工智能的发展,基于机器学习的语音转换技术应用场景越来越广泛,该领域的研究以及应用也进一步扩展。因该技术可以实现说话人的语音转换,语音转换技术在声音模仿,影视配音等各种场景下得到大量应用。
然而,未经允许的语音转换对语音安全造成了很大的威胁,利用语音转换实现诈骗等行为屡有出现,这使得说话人语音数据的泄露会造成极大的语音安全隐患。
针对上面的问题,提出一种面向语音转换的主动式取证方法,在说话人的语音数据上添加特定的噪声,可以帮助执法人员及相关部门确定语音转换的原始说话人,实现主动取证。因此,提供一种面向语音转换的主动式取证方法以解决上述问题,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明的目的在于针对现有的不法利用说话人语音数据实施语音转换达成非法目的的问题,提出一种面向语音转换的主动式取证方法,帮助执法人员及相关部门确定语音转换的原始说话人,实现主动取证。
为了实现上述目的,本发明采用如下技术方案:
一种面向语音转换的主动式取证方法,包括以下步骤:
S1构建音频文件集;其中,音频文件集由多个说话人的音频文件组成;
S2将目标说话人音频、音频文件集输入取证模型,在目标说话人音频上添加噪声,并利用原始说话人数据集对添加的噪声进行优化,得到优化完成的噪声;
S3基于优化完成的噪声对目标说话人、原始说话人的声纹进行相似度值计算,完成主动取证。
可选的,S1具体步骤包括:
S1.1搜集原始说话人语音数据集;
S1.2将原始说话人语音数据集中的音频数据进行预处理;
S1.3将预处理后的音频数据规范化为音频文件集。
可选的,S1.1具体步骤包括:
搜集若干开源的说话人语音数据集,构成说话人总人数为n的原始说话人语音数据集,其中n为大于1的整数。
可选的,S1.2具体步骤包括:
将原始说话人语音数据集中所有的音频数据通过重采样方法进行预处理。
可选的,S1.3具体步骤包括:
将预处理好的音频数据根据预设的文件格式,保存为音频文件;
将音频文件根据命名规范进行重命名;
将重命名后的音频文件组成为音频文件集。
可选的,S2具体步骤包括:
S2.1在待测目标的目标说话人音频上添加噪声,得到目标加噪音频;
S2.2通过说话人编码器分别在目标说话人音频、目标加噪音频中提取目标说话人语音特征向量、目标加噪语音特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211686243.6/2.html,转载请声明来源钻瓜专利网。