[发明专利]业务数据的特征提取方法、装置、服务器和存储介质在审

专利信息
申请号: 201810289688.8 申请日: 2018-03-30
公开(公告)号: CN110334720A 公开(公告)日: 2019-10-15
发明(设计)人: 刘昊骋;丁磊;徐西孟;宫健 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 业务数据 归一化 降维 目标编码 特征向量 预先提供 存储介质 特征提取 服务器 候选编码 候选特征 配置参数 自动生成 可复用 模块化 自动化
【说明书】:

发明实施例公开了一种业务数据的特征提取方法、装置、服务器和存储介质,该方法包括:确定业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项;其中,所述目标编码规则是从预先提供的各候选编码规则中确定的,所述目标归一化规则是从预先提供的各候选特征归一化规则中确定的,所述目标降维规则是从预先提供的各候选降维规则中确定;依据所述业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项,确定所述业务数据的特征向量。本发明实施例通过修改特征工程的配置参数,即可完成业务数据对应的特征向量的自动生成。实现了特征工程的模块化、自动化和可复用性,提高特征向量的生成效率和准确性。

技术领域

本发明实施例涉及机器学习技术领域,尤其涉及一种业务数据的特征提取方法、装置、服务器和存储介质。

背景技术

随着计算机技术和大数据应用的不断发展,越来越多的技术领域都会基于大数据进行机器学习建模,以模仿人类的思维模式,使各类电子产品提供更人性化的用户体验。

机器学习建模的前提是将业务数据进行处理,获取简化后且能够完全代表业务数据特点的特征向量。以特征向量为基础进行机器学习模型的构建,提高模型的构建效率和准确性。现有的机器学习建模平台提供了便于研发人员进行开发的图形操作界面,研发人员虽然不用编写大量的程序代码进行业务数据处理,但是在进行特征工程获取特征向量的过程,对业务数据做字段特征提取、特征编码和降维等操作时,仍需要根据业务概念人工逐一处理,人工进行特征编码、归一化和降维的特征工程。

然而,特征工程的人工处理方式局限性很大。特征维度较小的业务数据还在人工能够处理的范围内,但是一旦特征维度增加,人工进行特征工程的方式将耗费大量人力和时间,且用户需要多次尝试特征工程各方法以优化模型。同时不均衡或异常的样本数据还会对建模效果产生不良的影响。进而研发人员需要花大量的时间做重复性的特征工程和样本分析,使得模型上线周期很长,无法快速满足业务需求和模型迭代。

发明内容

本发明实施例提供了一种业务数据的特征提取方法、装置、服务器和存储介质,能够实现特征工程的模块化、自动化和可复用性,提高特征向量的生成效率和准确性。

第一方面,本发明实施例提供了一种业务数据的特征提取方法,包括:

确定业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项;以及

依据所述业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项,确定所述业务数据的特征向量。

第二方面,本发明实施例提供了一种业务数据的特征提取装置,包括:

规则配置模块,用于确定业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项;

特征生成模块,用于依据所述业务数据的目标编码规则、目标归一化规则和目标降维规则中的至少一项,确定所述业务数据的特征向量。

第三方面,本发明实施例提供了一种服务器,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的业务数据的特征提取方法。

第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的业务数据的特征提取方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810289688.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top