[发明专利]特征筛选方法、装置、计算机设备和存储介质在审
申请号: | 201810419513.4 | 申请日: | 2018-05-04 |
公开(公告)号: | CN108874879A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 叶俊锋;龙觉刚;孙成;赖云辉;罗先贤 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征筛选 计算机设备 存储介质 候选特征 目标业务 集合 初始特征集合 关联度 数据处理技术 目标对象 特征组合 有效特征 计算量 关联 | ||
本发明揭示了一种特征筛选方法、装置、计算机设备和存储介质,属于数据处理技术领域,该方法包括:提取目标对象的初始特征集合,从所述初始特征集合中排除与目标业务功能不相关的特征,得到候选特征集合,通过分别计算所述候选特征集合及所述候选特征集合中至少两个互不相同的特征组合与所述目标业务功能之间的关联度,并根据所述关联度从所述候选特征集合中确定与所述目标业务功能相关的有效特征。此外,还提供了特征筛选装置、计算机设备和存储介质。上述特征筛选方法、装置、计算机设备和存储介质能够简化与目标业务功能之间进行关联判断的计算量,缩减特征筛选的时间,有效提高特征筛选效率。
技术领域
本发明涉及数据处理技术领域,特别是涉及特征筛选方法、装置、计算机设备和存储介质。
背景技术
在对客户进行业务功能的判断时,需从客户的初始特征集合中提取有效特征,进而根据提取的有效特征进行业务功能的判断。例如,对客户做欺诈判断时,需要从该客户的初始特征集合中提取与欺诈相关的特征,进而根据提取的特征,对该客户进行欺诈判断。
目前,在对客户进行业务功能的判断而从客户的初始特征集合中提取有效特征时,只是通过启发式选择方法从客户的初始特征集合中进行特征筛选,而从初始特征集合中进行特征筛选时,需从初始特征集合中逐个提取特征加入到备选特征集合中,以对备选特征集合与业务功能之间进行关联度的计算,进而进行特征的筛选。但这种特征筛选方式的计算量太大,大大影响了特征筛选的效率。
发明内容
基于此,为解决相关技术中特征筛选的效率较低的技术问题,本发明提供了一种特征筛选方法、装置、计算机设备和存储介质。
第一方面,提供了一种特征筛选方法,包括:
提取目标对象的初始特征集合;
从所述初始特征集合中排除与目标业务功能不相关的特征,得到候选特征集合;
通过分别计算所述候选特征集合及所述候选特征集合中至少两个互不相同的特征组合与所述目标业务功能之间的关联度,并根据所述关联度从所述候选特征集合中确定与所述目标业务功能相关的有效特征。
在其中一个实施例中,所述通过大数据分析从所述初始特征集合中排除与目标业务功能不相关的特征,得到候选特征集合的步骤包括:
通过大数据分析计算所述初始特征集合中各特征与所述目标业务功能之间的OR值;
通过所述OR值排除所述初始特征集合中与目标业务功能不相关的特征,得到候选特征集合。
在其中一个实施例中,所述通过分别计算所述候选特征集合及所述候选特征集合中不同的特征组合与所述目标业务功能之间的关联度,并根据所述关联度从所述候选特征集合中确定与所述目标业务功能相关的有效特征的步骤包括:
从所述候选特征集合中选取至少两个互不相同的特征组合;
计算各特征组合与所述目标业务功能之间的关联度;
根据至少两个互不相同的特征组合及其对应关联度的比对,确定与所述目标业务功能相关的有效特征。
在其中一个实施例中,所述通过分别计算所述候选特征集合及所述候选特征集合中不同的特征组合与所述目标业务功能之间的关联度,并根据所述关联度从所述候选特征集合中确定与所述目标业务功能相关的有效特征的步骤包括:
从所述候选特征集合中进行至少两个互不相同的特征剔除得到第一特征组合;
通过所述候选特征集合、第一特征组合与所述目标业务功能之间的关联度比对,确定所述目标业务功能相关的核特征,得到核特征集合,并将所述核特征集合中的特征作为有效特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810419513.4/2.html,转载请声明来源钻瓜专利网。