[发明专利]基于多视图学习的欺诈标记的方法和装置在审
申请号: | 201910581229.1 | 申请日: | 2019-06-29 |
公开(公告)号: | CN110363415A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 孙涛;陈雪清;熊俊 | 申请(专利权)人: | 上海淇馥信息技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00;G06K9/62 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 201500 上海市崇明区横沙乡富民*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标记数据 分类器 次级分类器 方法和装置 用户数据 欺诈 学习 停止条件 样本数据 低成本 预设 协同 融合 | ||
1.基于多视图学习的欺诈标记的方法,包括,
获取用户数据集;
将用户数据集分为已标记数据集和未标记数据集;
在已标记数据集上,基于不同视图分别训练多个视图分类器;
使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记;
将标记后的数据加入已标记数据集,形成新的已标记数据集;
循环进行上述新的已标记数据集上,基于不同视图训练多个视图分类器以及使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记的动作,直至达到预设的停止条件;
融合多个视图分类器,生成次级分类器;
使用次级分类器对数据进行判断标记。
2.根据权利要求1所述的基于多视图学习的欺诈标记的方法,其中,
所述基于不同视图分别训练多个视图分类器包括,
基于来自不同视图的独立相容的特征训练多个视图分类器。
3.根据权利要求1至2任一项所述的基于多视图学习的欺诈标记的方法,其中,
所述基于来自不同视图的独立相容的特征训练多个视图分类中,所述独立相容的特征为视图的特征映射的输出空间一致性,且视图的特征之间具有独立性。
4.根据权利要求1至3任一项所述的基于多视图学习的欺诈标记的方法,其中,
所述将标记后的数据加入已标记数据集,形成新的已标记数据集,包括,
从标记后的数据中挑选多个预测置信度较高的数据加入已标记数据集,形成新的已标记数据集。
5.根据权利要求1至4任一项所述的基于多视图学习的欺诈标记的方法,其中,
所述预测置信度较高的数据包括预测最有把握的正样本和负样本。
6.根据权利要求1至5任一项所述的基于多视图学习的欺诈标记的方法,其中,
所述正样本和负样本的判断标准为,
设定阈值;
将判断结果大于阈值的设为正样本,反之则设为负样本。
7.根据权利要求1至6任一项所述的基于多视图学习的欺诈标记的方法,其中,
所述正样本数量小于负样本数量。
8.基于多视图学习的欺诈标记的装置,包括,
第一获取模块,用于获取用户数据集;
第一分类模块,用于将用户数据集分为已标记数据集和未标记数据集;
第一训练模块,用于在已标记数据集上,基于不同视图分别训练多个视图分类器;
第一判断标记模块,用于使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记;
循环判断标记模块,用于将标记后的数据加入已标记数据集,形成新的已标记数据集,循环进行上述新的已标记数据集上,基于不同视图训练多个视图分类器以及使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记的动作,直至达到预设的停止条件;
融合模块,用于融合多个视图分类器,生成次级分类器;
最终判断标记模块,用于使用次级分类器对数据进行判断标记。
9.一种服务器,包括处理器和存储器:
所述存储器用于存储执行权利要求1至7任一项所述方法的程序;
所述处理器被配置为用于执行所述存储器中存储的程序。
10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇馥信息技术有限公司,未经上海淇馥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910581229.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:配送区域的划分方法及装置
- 下一篇:金融资源分配方法、装置及电子设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理