[发明专利]特征抽取方法、装置、电子设备和计算机可读介质有效
申请号: | 202010461718.6 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111625692B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 杨文韬;胡肖 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 王刚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 抽取 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种特征抽取方法,包括:
获取表征不同数据源之间依赖关系的有向无环图,其中,所述有向无环图是根据特征集合中各个特征之间的依赖关系和各个特征对应的数据源生成的,所述特征集合包括第一特征集合和第二特征集合,所述第二特征是由所述第一特征集合中至少一个第一特征组合得到的,所述第一特征集合包括:文章的总点击数特征和文章的总展现数,所述第二特征集合包括:文章的点击率,所述第二特征相对应的抽取算子包括:文章的总点击数特征/文章的总展现数;
基于所述有向无环图,确定与所述第二特征集合中至少一个第二特征对应的依赖关系组和对应的数据源组集合;
基于所述依赖关系组和所述数据源组集合,将与所述至少一个第二特征中每个第二特征相对应的抽取算子放置在目标节点上,其中,所述目标节点是在所述有向无环图中表征所述第二特征对应的数据源的节点。
2.根据权利要求1所述的方法,其中,所述将与所述至少一个第二特征中每个第二特征相对应的抽取算子放置在目标节点上,包括:
基于所述依赖关系组和所述数据源组集合,将与所述第二特征集合中至少两个第二特征相对应的抽取算子集合放置在所述有向无环图中分别表征所述至少两个第二特征的数据源的节点上,其中,所述第二特征集合中至少两个第二特征之间没有依赖关系。
3.根据权利要求1所述的方法,其中,所述第二特征相对应的抽取算子是通过如下步骤获得的,包括:
基于确定的与所述第二特征集合中第二特征对应的依赖关系,确定第二特征的算子;
对所述第二特征进行预处理,确定第二特征的预处理算子;
基于所述第二特征的算子和所述第二特征的预处理算子,得到所述第二特征相对应的抽取算子。
4.根据权利要求1所述的方法,其中,所述将与所述至少一个第二特征中每个第二特征相对应的抽取算子放置在目标节点上,包括:
确定所述第二特征对应的抽取算子的算子标识,其中,根据所述抽取算子的算子标识能够对应着确定抽取算子的执行逻辑;
响应于所述抽取算子的算子标识注册过,在配置中的所述有向无环图中表征所述第二特征的数据源的节点上写明所述抽取算子的算子标识。
5.一种特征抽取装置,包括:
获取单元,被配置成获取表征不同数据源之间依赖关系的有向无环图,其中,所述有向无环图是根据特征集合中各个特征之间的依赖关系和各个特征对应的数据源生成的,所述特征集合包括第一特征集合和第二特征集合,所述第二特征是由所述第一特征集合中至少一个第一特征组合得到的,其中,所述第一特征集合包括:文章的总点击数特征和文章的总展现数,所述第二特征集合包括:文章的点击率,所述第二特征相对应的抽取算子包括:文章的总点击数特征/文章的总展现数;
确定单元,被配置成基于所述有向无环图,确定与所述第二特征集合中至少一个第二特征对应的依赖关系组和对应的数据源组集合;
放置单元,被配置成基于所述依赖关系组和所述数据源组集合,将与所述至少一个第二特征中每个第二特征相对应的抽取算子放置在相应节点上,其中,所述节点是在所述有向无环图中表征所述第二特征对应的数据源的交接点。
6.根据权利要求5所述的装置,其中,所述放置单元进一步被配置成:
基于所述依赖关系组和所述数据源组集合,将与所述第二特征集合中至少两个第二特征相对应的抽取算子集合放置在所述有向无环图中分别表征所述至少两个第二特征的数据源的节点上,其中,所述第二特征集合中至少两个第二特征之间没有依赖关系。
7.根据权利要求5所述的装置,其中,所述放置单元进一步被配置成:
确定所述第二特征对应的抽取算子的算子标识,其中,根据所述抽取算子的算子标识能够对应着确定抽取算子的执行逻辑;
响应于所述抽取算子的算子标识注册过,在配置中的所述有向无环图中表征所述第二特征的数据源的节点上写明所述抽取算子的算子标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461718.6/1.html,转载请声明来源钻瓜专利网。