[发明专利]一种特征加工脚本生成方法及装置在审
申请号: | 202010583227.9 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111782629A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 岑润哲 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/28;G06F8/30;G06F8/41 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 沈园园 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 加工 脚本 生成 方法 装置 | ||
1.一种特征加工脚本生成方法,其特征在于,包括:
获取输入的数据表信息,所述数据表信息包括原始字段信息;
识别所述原始字段信息对应的字段类型;
调用所述字段类型对应的第一加工函数;
确定根据所述第一加工函数对原始字段进行加工后得到的目标字段,获取所述目标字段对应的第一目标字段信息;
按照预设语法将所述数据表信息、第一加工函数及第一目标字段信息组合为特征加工脚本。
2.根据权利要求1所述的方法,其特征在于,所述获取输入的数据表信息,包括:
对所述数据表信息进行校验;
当确定所述数据表信息不合法时,生成提示修改信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述特征加工脚本进行语法检查;
当确定所述特征加工脚本不存在语法错误时,输出所述特征加工脚本。
4.根据权利要求1所述的方法,其特征在于,按照预设语法将所述数据表信息、第一加工函数及第一目标字段信息组合为特征加工脚本,包括:
将所述第一目标字段信息进行展示;
当接收到对所述第一目标字段信息的变更操作时,得到变更后的第二目标字段信息;
确定所述第二目标字段信息对应的第二加工函数;
按照预设语法将所述数据表信息、第二目标字段信息及第二加工函数组合为所述特征加工脚本。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取对所述特征加工脚本的任务拆分操作;
根据所述任务拆分操作,将所述特征加工脚本对应的任务表拆分为至少两个可并行处理的任务子表,所述任务子表中包括的目标字段之和等于所述任务表中包括的目标字段。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述特征加工脚本中的目标字段数量;
当所述目标字段数量超过预设阈值时,将所述特征加工脚本对应的任务表拆分为至少两个可并行处理的任务子表,所述任务子表中包括的目标字段之和等于所述任务表中包括的目标字段。
7.根据权利要求1所述的方法,其特征在于,所述第一加工函数包括聚合函数及命名函数;所述第一目标字段信息包括所述目标字段的字段名称;
所述确定根据所述第一加工函数对原始字段进行加工后得到目标字段的第一目标字段信息,包括:
对于通过所述聚合函数对所述原始字段进行聚合后得到的目标字段,通过所述命名函数生成所述目标字段对应的字段名称。
8.一种特征加工脚本生成装置,其特征在于,包括:
获取模块,用于获取输入的数据表信息,所述数据表信息包括原始字段信息;
识别模块,用于识别所述原始字段信息对应的字段类型;
调用模块,用于调用所述字段类型对应的第一加工函数;
确定模块,用于确定根据所述第一加工函数对原始字段进行加工后得到的目标字段,获取所述目标字段对应的第一目标字段信息;
生成模块,用于按照预设语法将所述数据表信息、第一加工函数及第一目标字段信息组合为特征加工脚本。
9.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述计算机程序时,实现权利要求1-7任一项所述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583227.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种测试数据的比对方法和装置
- 下一篇:一种铝型材表面氧化处理方法