[发明专利]欺诈识别方法、装置、电子设备及计算机可读存储介质有效
申请号: | 201911006499.6 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110648670B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 赖勇铨;贺亚运;林春;李美玲 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/18;G10L17/00;G06K9/62;G06Q40/02 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100010 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种欺诈识别方法,其特征在于,包括:
获取多个目标对象的音频信息;
基于所述多个目标对象的音频信息,通过预训练的第一深度学习模型提取各个所述目标对象的声纹特征得到声纹特征池;
通过聚类算法对所述声纹特征池中的各个声纹特征进行分团聚类处理得到至少一个分团,并以分团作为整体计算各个分团分别对应的相似度值,根据各个分团的相似度对所述各个分团进行排序;
基于各个分团的排序结果确定对应分团中包含的目标对象为欺诈目标对象;
所述分团聚类处理包括:步骤1、从特征向量池中随机不放回的抽取一个未成团的特征点作为一个团的初始成员;步骤2、依次检测特征向量池中每个特征点与这个团里所有成员的平均距离,如果距离小于指定阀值则加入到此团中来,如果某个特征点和其它所有其它特征点的距离都大于指定阀值,则此特征点单独成团;步骤3、之后再从特征向量池中随机不放回抽取一个未成团的特征点,重复1,2过程,直到特征向量池中所有成员都已成团,聚类结束。
2.根据权利要求1所述的方法,其特征在于,所述获取多个目标对象的音频信息,之前包括:
获取所述目标对象与相应客服之间的通话语音信息;
基于相应的语音分离算法将所述目标对象与相应客服的通话语音信息进行语音分离;
基于所述目标对象与相应客服之间的通话语音信息语音分离后的音频,确定所述目标对象的音频信息。
3.根据权利要求2所述的方法,其特征在于,所述基于相应的语音分离算法将所述目标对象与相应客服的通话语音信息进行语音分离,包括以下至少一项:
通过卷积神经网络与循环神经网络,将各个所述目标对象与相应客服的通话语音信息进行语音分离;
通过滑窗法与K-Means聚类算法,将各个所述目标对象与相应客服的通话语音信息进行语音分离。
4.根据权利要求3所述的方法,其特征在于,所述通过卷积神经网络与循环神经网络,将各个所述目标对象与相应客服的通话语音信息进行语音分离,包括:
获取所述目标对象与相应客服的通话语音信息对应的声谱图;
基于预训练的卷积神经网络提取所述声谱图的三维特征,所述三维特征包括时间维度特征、频率维度特征、通道维度特征;
对所述三维特征在频率维度进行平均池化处理,得到池化处理后的特征;
将所述池化处理后的特征输入至预训练的循环神经网络,得到时间维度上的分割标签;
基于所述时间维度上的分割标签对所述目标通话音频进行语音分离。
5.根据权利要求3所述的方法,其特征在于,所述通过滑窗法与K-Means聚类算法,将各个所述目标对象与相应客服的通话语音信息进行语音分离,包括:
通过滑窗法基于预训练的第二深度学习模型提取所述目标对象与相应客服的通话语音信息的语音特征,得到特征向量数组;
对所述特征向量数组进行K-Means聚类,得到各个特征向量的标签;
基于所述各个特征向量的标签,将各个所述目标对象与相应客服的通话语音信息进行语音分离。
6.根据权利要求2-5任一项所述的方法,其特征在于,所述基于所述目标对象与相应客服之间的通话语音信息语音分离后的音频,确定所述目标对象的音频信息,包括:
提取所述目标对象与相应客服之间的通话语音信息语音分离后的音频的声纹特征;
计算语音分离后的音频的声纹特征与预存储的至少一个客服的声纹特征的相似度;
基于相似度计算结果,确定所述目标对象的音频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006499.6/1.html,转载请声明来源钻瓜专利网。