[发明专利]展示预测模型的方法、装置及调整预测模型的方法、装置有效

专利信息
申请号: 201810736056.1 申请日: 2016-04-27
公开(公告)号: CN108960514B 公开(公告)日: 2022-09-06
发明(设计)人: 白杨;陈雨强;戴文渊 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06F17/17 分类号: G06F17/17
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 于翔;田方
地址: 100085 北京市海淀区上*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 展示 预测 模型 方法 装置 调整
【说明书】:

本发明公开了一种对预测模型进行展示的方法、装置及调整预测模型的方法、装置。其中,获取预测模型针对至少一个预测样本得到的至少一个预测结果;基于至少一个预测样本和至少一个预测结果来获取用于训练决策树模型的至少一个决策树训练样本,其中,决策树模型用于拟合预测模型;使用至少一个决策树训练样本来训练决策树模型;以及可视化地展示训练出的决策树模型。本发明可以将难以理解的预测模型近似为决策树模型,并对近似出的决策树模型进行展示,以使得用户基于所展示的决策树模型可以较好地理解预测模型。

本申请是申请日为2016年4月27日、申请号为201610269127.2、题为“展示预测模型的方法、装置及调整预测模型的方法、装置”的专利申请的分案申请。

技术领域

本发明涉及数据科学领域,特别是涉及一种对预测模型进行展示的方法、装置及调整预测模型的方法、装置。

背景技术

在传统的数据挖掘方式中,往往利用统计的方法对历史数据进行回归分析或因子分析,进而剖析历史数据的成因,并利用得到的规律组建决策引擎。统计学习理论中,结构化风险等于经验风险与置信风险的总和。其中,经验风险是学习获取的知识在给定的样本集上的误差,而置信风险是知识在未知样本上的误差。因此,传统的统计方法仅仅做到了在已知样本上的风险最小化,无法保证在未知样本上置信风险的抑制。也就是说,从统计学习的角度来看,这种方式仅仅做到了统计,并未真正有效地从历史数据中学习出知识。

近年来,随着大数据、云计算和人工智能等技术的发展,机器学习被广泛地用来从海量数据挖掘出其中隐藏的有用信息。

关于统计学习与机器学习的区别已经有不少讨论,很大程度上认为机器学习侧重于目标预测,而统计学习侧重于模型的可解释性。更加直观的理解是,统计学习侧重于从概率分布来描述数据生成机制,除了预测之外,还关心结果(参数假设、误差分布假设)的检验,而机器学习侧重于从函数拟合角度来描述数据生成机制,基本目的就是为了拟合和预测,缺乏严谨的参数、误差的检验机制。

一般说来,机器学习主要分为有监督学习、无监督学习和半监督学习。有监督学习是日常使用最多的建模范式,基于有监督学习可得到很多具体的模型,比如回归模型、分类模型等。有监督学习从给定的训练样本集中学习出一个由函数和参数组成的模型,当新的数据样本到来时,可以根据这个模型来给出相应的预测结果。有监督学习的训练样本集要求是包括输入和输出的,也可以说是特征变量和目标输出。其中,目标是标注好的样本标记。无监督学习与有监督学习相比,训练集没有标注的目标结果。常见的无监督学习算法有聚类。此外,有监督学习和无监督学习还可结合为半监督学习,即,训练样本集之中的一部分训练样本带有标记,而其他训练样本不含有标记。

如上所述,机器学习本身侧重于预测而缺少对数据生成机制的可解释性,相应地,训练出的机器学习模型可表示为不同参数和形式的函数集,而且,随着不同行业数据规模的持续上升,用于进行训练的样本特征维度(特别是在经过离散化处理之后)正在高速增长,这些都导致普通用户难以理解机器学习模型的构成,例如,无法了解各个特征在其中如何交互、共同起到了什么样的作用。

举例来说,深度学习(deep learning)作为机器学习的分支,其系统包括由输入层、隐层(多层)、输出层组成的多层网络,只有相邻层节点(或称“神经元”,或“单元”)之间有连接,同一层以及跨层节点之间相互无连接,每一层的每一个神经元节点可以看作是一个逻辑回归(logistic regression)模型,各分层结构接近人类大脑的结构,但作为模型却难以理解。

图1示出深度学习模型及其神经元的示例。可以看出,图1中的(a)所表示的深度学习模型由大量的节点相互联接构成。每个节点代表一种特定的输出函数,称为激活函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(weight),这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激活函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810736056.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top