[发明专利]一种特征库动态调整的方法和装置在审
申请号: | 202011037242.X | 申请日: | 2020-09-27 |
公开(公告)号: | CN112231299A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 马堃 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/28;G06F16/215;G06F16/22;G06Q10/06 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;李阳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 动态 调整 方法 装置 | ||
1.一种特征库动态调整的方法,其特征在于,包括:
接收上游业务组件通过接口传输的特征数据,以得到基于不同业务类型的数据集合;
根据预设的属性标签,对所有业务类型的数据打标签,进而归类至所述标签对应的数据表中;
调用预设的匹配模型,基于多个数据表生成目标数据宽表,以将所述目标数据宽表存入相应的目标特征池中;
待接收到外部应用模型的数据请求,获取所述请求中的特征变量,进而从目标特征池中得到相应的特征数据,以生成特征数据集并输出。
2.根据权利要求1所述的方法,其特征在于,归类至所述标签对应的数据表中之后,包括:
调用特征加工引擎,根据不同标签对应的数据表的加工配置信息,获取相应的加工程序;
触发所述加工程序,基于预设的加工模型,对数据表中的特征数据进行加工;其中,加工模型包括清洗模型、衍生模型和筛选模型。
3.根据权利要求1所述的方法,其特征在于,从目标特征池中得到相应的特征数据,以生成特征数据集并输出,包括:
从目标特征池中得到相应的特征数据,生成特征数据集;
根据外部应用模型的训练信息,将所述特征数据集拆分为样本集和验证集,并将所述样本集和验证集输出。
4.根据权利要求1所述的方法,其特征在于,包括:
根据预设的评估周期,调用指标计量引擎,对目标特征池中的特征变量计算评估分数并排序;
待接收到特征调整指令,获取预设时间段内所有特征数据的评估分数和排序,得到待删除特征变量,进而将目标特征池中的待删除特征变量去除。
5.根据权利要求4所述的方法,其特征在于,得到待删除特征变量之后,还包括:
更新所述待删除特征变量对应的上游业务组件数据传输接口的配置信息,以使所述接口不传输所述待删除特征变量。
6.根据权利要求1所述的方法,其特征在于,得到待删除特征变量之后,还包括:
根据上游业务组件数据传输接口的配置信息,如果所述待删除特征变量包括了配置信息中的所有特征变量,则关闭该上游业务组件数据传输接口。
7.根据权利要求1-6任一所述的方法,其特征在于,待接收到外部应用模型的数据请求之后,包括:
获取所述请求中的特征变量,确定目标特征池中不存在相应的特征变量,则配置所述特征变量对应的上游业务组件数据传输接口。
8.一种特征库动态调整的装置,其特征在于,包括:
获取模块,用于接收上游业务组件通过接口传输的特征数据,以得到基于不同业务类型的数据集合;
处理模块,用于根据预设的属性标签,对所有业务类型的数据打标签,进而归类至所述标签对应的数据表中;调用预设的匹配模型,基于多个数据表生成目标数据宽表,以将所述目标数据宽表存入相应的目标特征池中;
生成模块,用于待接收到外部应用模型的数据请求,获取所述请求中的特征变量,进而从目标特征池中得到相应的特征数据,以生成特征数据集并输出。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011037242.X/1.html,转载请声明来源钻瓜专利网。