[发明专利]基于DNN的回归分布模型及其训练方法、电子设备有效
申请号: | 201910041056.4 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109903075B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 张发恩;刘俊龙;周鹏程 | 申请(专利权)人: | 创新奇智(合肥)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/08 |
代理公司: | 深圳市智享知识产权代理有限公司 44361 | 代理人: | 王琴;蒋慧 |
地址: | 230000 安徽省合肥市高新区习友路333*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dnn 回归 分布 模型 及其 训练 方法 电子设备 | ||
1.一种基于DNN的回归分布模型训练方法,其用于训练获得回归分布模型W(x,a)=b,所述回归分布模型用于商场预测客流量、银行预测客户购买理财产品之概率的模型,x为特征值,其包括n个子特征,n≥1,a和b其中一者为分位点,另一者为对应分位点的回归值;其特征在于:基于DNN的回归分布模型训练方法包括:
步骤S1:提供k个用于训练回归分布模型W(x,a)=b的训练样本,k≥1;每一训练样本具有已知的特征值和回归值,所述训练样本通过以往的经验数据获得,所述特征值对应为特征对应的值,所述特征包括天气、温度、时间、学历以及年龄;
步骤S2:构建DNN;DNN包括输入层、隐藏层及输出层;输入层包括对应特征值之输入的神经元,输入层及隐藏层的至少一层中包括对应a的随机采样值之输入的神经元,输出层为单个神经元,其对应b的取值;及
步骤S3:将所述样本输入至DNN中,利用前向传播算法及反向传播算法训练获得回归分布模型W(x,a)=b;
所述a为分位点,所述b为回归值,令a=q,b=y,在步骤S3包括:
步骤S31:训练获得的第一模型,第一模型为预测任意分位点的回归值之模型F(x,q)=y;
步骤S32:训练获得的第二模型,第二模型为预测任意回归值的分位点之模型Q(x,y)=q;及
步骤S33:第一模型与第二模型之间组成对偶学习以优化第一模型和/或第二模型。
2.如权利要求1所述的基于DNN的回归分布模型训练方法,其特征在于:所述a为分位点,所述b为回归值,令分位点为q,a=q,回归值为y,b=y,在步骤S3中训练获得的模型为预测任意分位点的回归值之模型F(x,q)=y,在步骤S3中,反向传播算法中,损失函数为:
xi为训练样本中的某一特征值,q为(0,1)区间内的随机采样值;yi为训练样本中的所述某一特征值对应的回归值。
3.如权利要求1所述的基于DNN的回归分布模型训练方法,其特征在于:所述b为分位点,所述a为回归值,令分位点为q,b=q,回归值为y,a=y,在步骤S3中训练获得的模型为预测任意回归值的分位点之模型Q(x,y)=q,在步骤S3中,在反向传播算法中,损失函数为:
xi为训练样本中的某一特征值,y为经验回归值区间内的随机采样值;
yi为训练样本中的所述某一特征值对应的分位点。
4.如权利要求1所述的基于DNN的回归分布模型训练方法,其特征在于:所述对偶学习包括步骤:
步骤S331:设置对偶损失函数;及
步骤S332:至少通过所述对偶损失函数进行反向传播以训练所述第一模型和/或第二模型。
5.如权利要求4所述的基于DNN的回归分布模型训练方法,其特征在于:所述对偶损失函数包括第一对偶损失函数:
LDF=|Q(xi,F(xi,q))-q|p
其中,xi为训练样本中的某一特征值;p为指数。
6.如权利要求4或5所述的基于DNN的回归分布模型训练方法,其特征在于:所述对偶损失函数包括第二对偶损失函数:
LDQ=|F(xi,Q(xi,y))-y|p
其中,xi为训练样本中的某一特征值;p为指数。
7.如权利要求1所述的基于DNN的回归分布模型训练方法,其特征在于:所述a为分位点时,在步骤S2中,对应a的随机采样值为(0,1)区间内的随机采样值;所述a为回归值时,在步骤S2中,对应a的随机采样值为经验回归值区间内的随机采样值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(合肥)科技有限公司,未经创新奇智(合肥)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041056.4/1.html,转载请声明来源钻瓜专利网。