[发明专利]生成机器学习样本的组合特征的方法及系统在审
申请号: | 202010658034.5 | 申请日: | 2017-09-28 |
公开(公告)号: | CN111797998A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 戴文渊;杨强;陈雨强;张舒羽;栾淑君;孙迪 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;张云珠 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 机器 学习 样本 组合 特征 方法 系统 | ||
1.一种生成机器学习样本的组合特征的方法,包括:
(A)获取能够进行组合的单位特征;
(B)向用户提供用于设置特征组合配置项的图形界面,其中,所述特征组合配置项用于限定如何在单位特征之间进行特征组合;
(C)接收用户为了设置特征组合配置项而在图形界面上执行的输入操作,并根据所述输入操作来获取用户设置的特征组合配置项;以及
(D)基于获取的特征组合配置项对单位特征之中的待组合特征进行组合,以生成机器学习样本的组合特征。
2.根据权利要求1所述的方法,其中,特征组合配置项包括以下项之中的至少一项:特征配置项,用于指定单位特征之中的待组合特征,使得在步骤(D)中对指定的待组合特征进行组合;评价指标配置项,用于指定组合特征的评价指标,使得在步骤(D)中按照指定的评价指标来衡量与各种组合特征相应的机器学习模型的效果以确定待组合特征的组合方式;训练参数配置项,用于指定机器学习模型的训练参数,使得在步骤(D)中通过衡量在指定的训练参数下得到的与各种组合特征相应的机器学习模型的效果来确定待组合特征的组合方式。
3.根据权利要求2所述的方法,其中,特征组合配置项还包括:分桶运算配置项,用于指定将对待组合特征之中的至少一个连续特征分别执行的一种或多种分桶运算,使得在步骤(D)中对所述至少一个连续特征分别执行指定的一种或多种分桶运算以得到相应的一个或多个分桶特征,并将得到的分桶特征作为整体与其他待组合特征进行组合。
4.根据权利要求3所述的方法,其中,所述分桶运算配置项用于分别针对每一个连续特征指定一种或多种分桶运算;或者,所述分桶运算配置项用于针对所有连续特征统一指定一种或多种分桶运算。
5.根据权利要求1所述的方法,还包括:
(E)向用户显示生成的组合特征。
6.根据权利要求5所述的方法,其中,在步骤(E)中,还向用户显示每个组合特征关于评价指标的评价值。
7.根据权利要求1所述的方法,还包括:
(F)直接将生成的组合特征应用于后续的机器学习步骤。
8.一种生成机器学习样本的组合特征的系统,包括:
单位特征获取装置,用于获取能够进行组合的单位特征;
显示装置,用于向用户提供用于设置特征组合配置项的图形界面,其中,所述特征组合配置项用于限定如何在单位特征之间进行特征组合;
配置项获取装置,用于接收用户为了设置特征组合配置项而在图形界面上执行的输入操作,并根据所述输入操作来获取用户设置的特征组合配置项;以及
组合特征生成装置,用于基于获取的特征组合配置项对单位特征之中的待组合特征进行组合,以生成机器学习样本的组合特征。
9.一种用于生成机器学习样本的组合特征的计算机可读介质,其中,在所述计算机可读介质上记录有用于执行如权利要求1至7任一所述的生成机器学习样本的组合特征的方法的计算机程序。
10.一种用于生成机器学习样本的组合特征的计算装置,包括存储部件和处理器,其中,存储部件中存储有计算机可执行指令集合,当所述计算机可执行指令集合被所述处理器执行时,执行如权利要求1至7任一所述的生成机器学习样本的组合特征的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010658034.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金压条微切机
- 下一篇:一种动态低剂量DSA成像方法