[发明专利]一种逻辑回归模型的构建方法及系统在审
申请号: | 201811142852.9 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109299740A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 王军平 | 申请(专利权)人: | 北京赛博贝斯数据科技有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/31;G06F16/215;G06F16/28 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;张国香 |
地址: | 102200 北京市昌平区沙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 逻辑回归模型 训练数据集 评估函数 构建 分类数据 自变量 逻辑函数 特征数据 训练数据 预设 申请 | ||
1.一种逻辑回归模型的构建方法,其特征在于,所述方法包括:
获取训练数据集和所述训练数据集对应的分类数据,其中,所述训练数据集中包括多个特征数据;
基于预设逻辑函数和所述训练数据集以及所述分类数据,建立待评估函数;
在所述待评估函数取最小值时,将所述待评估函数中的自变量作为构建的逻辑回归模型。
2.根据权利要求1所述的方法,其特征在于,建立待评估函数包括:
在所述分类数据的取值为1或0的情况下,基于预设逻辑函数计算所述训练数据集中单个特征数据的后验概率;
根据所述训练数据集和所述分类数据,计算所述后验概率的极大似然函数;
将所述极大似然函数取对数,并将取对数后的结果作为建立的所述待评估函数。
3.根据权利要求2所述的方法,其特征在于,按照以下公式计算所述训练数据集中单个特征数据的后验概率:
p(y|x,θ)=(hθ(x))y(1-hθ(x))1-y
其中,p(y|x,θ)表示所述后验概率,hθ(x)表示所述预设逻辑函数,θ表示待构建的逻辑回归模型的自变量,x表示训练数据集中的特征数据,y表示所述分类数据,其中,y取值1或0。
4.根据权利要求3所述的方法,其特征在于,按照以下公式计算所述后验概率的极大似然函数:
其中,L(θ|x,y)表示所述极大似然函数,m表示所述分类数据中数据的总数量。
5.根据权利要求2所述的方法,其特征在于,所述待评估函数的最小值利用梯度下降法求解。
6.根据权利要求1所述的方法,其特征在于,在构建了所述逻辑回归模型之后,所述方法还包括:
获取评价信息集,并利用所述逻辑回归模型对所述评价信息集中的评价样本进行预测;
根据预测结果,计算所述逻辑回归模型的精度参数和召回率参数,其中,所述精度参数和所述召回率参数用于表征所述逻辑回归模型的预测准确度。
7.一种逻辑回归模型的构建系统,其特征在于,所述系统包括:
数据获取单元,用于获取训练数据集和所述训练数据集对应的分类数据,其中,所述训练数据集中包括多个特征数据;
待评估函数建立单元,用于基于预设逻辑函数和所述训练数据集以及所述分类数据,建立待评估函数;
逻辑回归模型构建单元,用于在所述待评估函数取最小值时,将所述待评估函数中的自变量作为构建的逻辑回归模型。
8.根据权利要求7所述的系统,其特征在于,所述待评估函数建立单元包括:
后验概率计算模块,用于在所述分类数据的取值为1或0的情况下,基于预设逻辑函数计算所述训练数据集中单个特征数据的后验概率;
极大似然函数计算模块,用于根据所述训练数据集和所述分类数据,计算所述后验概率的极大似然函数;
取对数模块,用于将所述极大似然函数取对数,并将取对数后的结果作为建立的所述待评估函数。
9.根据权利要求8所述的系统,其特征在于,所述后验概率计算模块按照以下公式计算所述训练数据集中单个特征数据的后验概率:
p(y|x,θ)=(hθ(x))y(1-hθ(x))1-y
其中,p(y|x,θ)表示所述后验概率,hθ(x)表示所述预设逻辑函数,θ表示待构建的逻辑回归模型的自变量,x表示训练数据集中的特征数据,y表示所述分类数据,其中,y取值1或0。
10.根据权利要求9所述的系统,其特征在于,所述极大似然函数计算模块按照以下公式计算所述后验概率的极大似然函数:
其中,L(θ|x,y)表示所述极大似然函数,m表示所述分类数据中数据的总数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛博贝斯数据科技有限责任公司,未经北京赛博贝斯数据科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811142852.9/1.html,转载请声明来源钻瓜专利网。