[发明专利]特征数据生成方法、电子设备、存储介质有效
申请号: | 202110996469.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113688191B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 王林;王桐;邓玉明 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F18/2113 | 分类号: | G06F18/2113;G06F16/28;G06N3/0475;G06N3/092;G06N20/20 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 数据 生成 方法 电子设备 存储 介质 | ||
本申请实施例提供了一种特征数据生成方法、电子设备、计算机存储介质及程序产品,其中,所述特征数据生成方法包括:根据待生成特征数据的目标实体,从特征范式集中获取与所述目标实体对应的所有特征范式,所述特征范式用于描述基于实体关系数据的实体特征生成规则信息;按照选取策略,从获取的所有特征范式中选取特征范式,并根据选取的特征范式所描述的实体特征生成规则信息,确定特征范式对应的特征值;对所述特征值进行评估获得评估结果,并将评估结果优于历史特征值的评估结果的特征值确定为有效特征值;根据所述有效特征值和所述有效特征值对应的所述特征范式,生成所述目标实体的特征数据。通过本申请实施例,提高了特征数据的生成效率。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种特征数据生成方法、电子设备、计算机存储介质及计算机程序产品。
背景技术
特征工程是机器学习的必备环节,其通过一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。
伴随着计算机技术的发展,特征工程也已发展到了自动化阶段。在目前的特征工程自动化方面,涉及两个阶段的自动化工作,包括一阶段原始特征生成(多特征表生成特征宽表)和二阶段高阶特征组合。但是,一方面,好的特征工程方案仍然需要结合专家的领域知识,通过不断探索和反复试错才能获得,这个过程约占算法研发70%以上人力成本。另一方面,目前大部分的特征工程自动化聚焦于处理二阶段高阶特征组合方向,而针对一阶段原始特征生成方向的自动化方案则少有人问津。
因此,如何提供一种较低成本的、可适用于一阶段原始特征生成的方案,成为亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供一种特征数据生成方案,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种特征数据生成方法,包括:根据待生成特征数据的目标实体,从特征范式集中获取与所述目标实体对应的所有特征范式,其中,所述特征范式用于描述基于实体关系数据的实体特征生成规则信息;按照选取策略,从获取的所有特征范式中选取特征范式,并根据选取的所述特征范式所描述的实体特征生成规则信息确定特征范式对应的特征值;对所述特征值进行评估获得评估结果,并将评估结果优于历史特征值的评估结果的特征值确定为有效特征值;根据所述有效特征值和所述有效特征值对应的所述特征范式,生成所述目标实体的特征数据。
根据本申请实施例的第二方面,提供了一种特征数据生成装置,包括:获取模块,用于根据待生成特征数据的目标实体,从特征范式集中获取与所述目标实体对应的所有特征范式,其中,所述特征范式用于描述基于实体关系数据的实体特征生成规则信息;第一确定模块,用于按照选取策略,从获取的所有特征范式中选取特征范式,并根据选取的所述特征范式所描述的实体特征生成规则信息确定特征范式对应的特征值;第二确定模块,用于对所述特征值进行评估获得评估结果,并将评估结果优于历史特征值的评估结果的特征值确定为有效特征值;生成模块,用于根据所述有效特征值和所述有效特征值对应的所述特征范式,生成所述目标实体的特征数据。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的方法对应的操作。
根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的方法。
根据本申请实施例的第五方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如第一方面所述的方法对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110996469.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置