[发明专利]视频数据的欺诈检测方法、装置、计算机设备和存储介质在审
申请号: | 201910882668.6 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110781916A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 朱文和 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G10L25/27;G06K9/00;G10L25/63 |
代理公司: | 44224 广州华进联合专利商标代理有限公司 | 代理人: | 谢曲曲 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频数据 欺诈检测 图像数据集 图像数据 图像特征向量 语音特征向量 检测 多模态特征 语音数据 视频帧 向量 图像特征提取 计算机设备 连续视频帧 特征信息量 存储介质 时间序列 特征信息 全面性 级联 拼接 多样性 输出 申请 | ||
本申请涉及一种视频数据的欺诈检测方法、装置、计算机设备和存储介质。所述方法包括:获取待检测视频数据;从待检测视频数据中提取出各视频帧的图像数据,按照各视频帧的时间序列将图像数据划分为多个图像数据集,图像数据集包含连续视频帧对应的图像数据;将各图像数据集输入至预先训练好的图像特征提取模型中,得到图像特征向量;从待检测视频数据中提取语音数据,并获取语音数据的语音特征向量;对图像特征向量以及语音特征向量进行级联拼接,得到多模态特征向量;将多模态特征向量输入预先训练好的欺诈检测模型,得到欺诈检测模型输出的待检测视频数据对应的欺诈检测结果。采用本方法能够增大特征信息量,提高特征信息的全面性以及多样性,有效提高视频数据欺诈检测的准确性。
技术领域
本申请涉及计算机信息处理技术领域,特别是涉及一种欺诈识别方法、装置、计算机设备和存储介质。
背景技术
在日常生活中有不同的面审环节,例如在金融信贷面审环节、刑侦审讯环节、职场面试等,在面审过程中,被提问对象是否在撒谎、欺诈行为通常依靠提问者的经验进行分析判断,往往耗费大量时间和人力;而基于机器学习的欺诈识别通常是对面审过程中的音频数据进行欺诈识别以判断被提问对象是否在撒欢,但是通过对音频数据进行分析以实现欺诈识别的识别效果并不理想,识别结果准确度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种视频数据的欺诈检测方法、装置、计算机设备和存储介质。
一种视频数据的欺诈检测方法,所述方法包括:
获取待检测视频数据;
从所述待检测视频数据中提取出各视频帧的图像数据,按照各所述视频帧的时间序列将所述图像数据划分为多个图像数据集,所述图像数据集包含连续视频帧对应的图像数据;
将各所述图像数据集输入至预先训练好的图像特征提取模型中,得到图像特征向量;
从所述待检测视频数据中提取语音数据,并获取语音数据的语音特征向量;
对所述图像特征向量以及所述语音特征向量进行级联拼接,得到多模态特征向量;
将所述多模态特征向量输入预先训练好的欺诈检测模型,得到所述欺诈检测模型输出的所述待检测视频数据对应的欺诈检测结果。
在其中一个实施例中,所述语音数据包括音频数据;
所述获取语音数据的语音特征向量的步骤,包括:
以预设步长以及预设窗口长度获取所述音频数据的分帧数据;
对各所述分帧数据进行傅里叶分析获取梅尔频谱数据;
对所述梅尔频谱数据进行倒谱分析,得到音频特征向量
在其中一个实施例中,所述语音数据包括文本数据;
所述获取语音数据的语音特征向量的步骤,包括:
对所述文本数据进行分句处理得到句子文本,并对各所述句子文本进行分词处理,得到句子中的词序列;
利用预设词向量模型获取各所述词序列的词向量,根据所述句子文本中各个词序列对应的词向量,获取所述句子文本的文本特征向量。
在其中一个实施例中,所述获取待检测视频数据的步骤,包括:
获取视频数据,将所述视频数据切分为多个数据长度为预设视频长度的视频片段数据,将所述视频片段数据确定为待检测视频数据;
所述得到所述欺诈检测模型输出的所述待检测视频数据对应的欺诈检测结果的步骤之后,还包括:
根据各所述视频片段数据的欺诈检测结果,确定所述视频数据的欺诈检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910882668.6/2.html,转载请声明来源钻瓜专利网。