[发明专利]特征抽取方法、机器学习方法及其装置在审
申请号: | 201910743847.1 | 申请日: | 2016-01-08 |
公开(公告)号: | CN110442417A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | 白杨;陈雨强 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F9/451 | 分类号: | G06F9/451;G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 徐璐璐;朱志玲 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了特征抽取方法、机器学习方法和对应的装置。特征抽取方法包括:获取数据记录;获取用于限定如何从数据记录抽取预定特征的特征抽取配置项,其中,每种预定特征的特征抽取配置项包括来源字段项和处理方法项,来源字段项用于将每种预定特征所涉及的数据记录的字段限定为来源字段,处理方法项用于指定对预先编程为可执行代码的数据处理函数的引用,其中,数据处理函数用于针对由来源字段项限定的来源字段的字段值执行用于抽取所述每种预定特征的数据处理;基于特征抽取配置项对数据记录的字段值执行数据处理以获取所述预定特征的特征值。根据本发明实施例的特征抽取和机器学习技术增强了编程的灵活性和代码的重用性,特别适合于大数据应用。 | ||
搜索关键词: | 字段 特征抽取 预定特征 数据记录 配置项 数据处理函数 机器学习 数据处理 抽取 机器学习技术 可执行代码 获取数据 预先编程 装置提供 大数据 重用性 编程 引用 记录 应用 | ||
【主权项】:
1.一种针对数据记录进行特征抽取的方法,包括:数据记录获取步骤,获取数据记录;特征抽取配置项获取步骤,获取用于限定如何从所述数据记录抽取预定特征的特征抽取配置项,其中,每种预定特征的特征抽取配置项包括来源字段项和处理方法项,来源字段项用于将所述每种预定特征所涉及的数据记录的字段限定为来源字段,处理方法项用于指定对预先编程为可执行代码的数据处理函数的引用,其中,所述数据处理函数用于针对由来源字段项限定的来源字段的字段值执行用于抽取所述每种预定特征的数据处理;以及特征值获取步骤,基于特征抽取配置项对所述数据记录的字段值执行数据处理以获取所述预定特征的特征值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910743847.1/,转载请声明来源钻瓜专利网。