[发明专利]基于统计概率的损失函数计算方法、电子设备、存储介质在审
申请号: | 201811033070.1 | 申请日: | 2018-09-05 |
公开(公告)号: | CN109325528A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 马瑞;丁志禄 | 申请(专利权)人: | 浙江长兴笛卡尔科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 胡拥军;糜婧 |
地址: | 313100 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 惩罚项 统计 损失函数 分类概率 分类结果 概率矩阵 向量 概率 电子设备 分类器 分类 可读存储介质 原始数据集 存储介质 机器学习 类别提取 数据分类 整合 惩罚 | ||
1.基于统计概率的损失函数计算方法,其特征在于包括以下步骤:
数据分类,对原始数据集通过分类器进行分类,得到分类结果概率矩阵;
计算损失,通过损失函数计算所述分类结果概率矩阵中每一分类概率向量的损失,得到总体损失;
计算统计惩罚项,通过统计惩罚项计算方法计算所述分类结果概率矩阵中每一数据分类概率对应的统计惩罚项,得到总体统计惩罚项;
损失重构,将所述总体损失中每一所述分类概率向量对应的损失与所述总体统计惩罚项中每一所述分类概率向量对应的统计惩罚项进行整合,得到带统计惩罚项的损失函数。
2.如权利要求1所述的基于统计概率的损失函数计算方法,其特征在于:所述数据分类中具体包括以下步骤:
将所述原始数据集表示为数据集向量,所述数据集向量公式如下:
其中,S为数据集向量,g为数据集向量S中数据个数,Si为数据集向量S中第i个数据,Si的公式如下:
其中,fj为Si中第j个特征;
采用分类算法对数据集向量S进行分类,得到分类结果概率矩阵,公式如下:
其中,CA为分类算法,Parameter为CA中需要训练的参数,S为数据集向量,P为分类结果概率矩阵,为第g个数据属于第n类的概率。
3.如权利要求2所述的基于统计概率的损失函数计算方法,其特征在于,所述计算损失中具体包括以下步骤:
获取所述分类结果概率矩阵中第i个数据对应的分类概率向量,具体公式如下:
通过损失函数计算第i个数据对应的分类概率向量的损失,具体公式如下:
lossi=LF(ki,pi)
通过每一个数据对应的分类概率向量的损失生成总体损失,具体公式如下:
其中,pi为第i个数据对应的分类概率向量,lossi为第i个数据对应的分类概率向量的损失,Loss为总体损失,LF为损失函数,ki为数据Si的真实分类结果。
4.如权利要求3所述的基于统计概率的损失函数计算方法,其特征在于,所述计算统计惩罚项中具体包括以下步骤:
通过统计惩罚项计算方法计算每一所述分类概率向量中当前数据属于除当前分类外其他分类的概率总和占当前数据属于当前分类的概率的比值,具体公式如下:
其中,PF(p)为总体统计惩罚项,PF(pi)为数据Si在分类算法CA下的分类惩罚矩阵,具体公式如下:
其中,为数据Si属于m分类概率对应的统计惩罚项,具体公式如下:
5.如权利要求4所述的基于统计概率的损失函数计算方法,其特征在于:所述损失重构中具体包括以下步骤:
将所述总体损失中第i个数据对应的分类概率向量的损失及第i个数据在分类算法CA下的分类惩罚矩阵进行整合,具体公式为:
PLF(lossi,PF(pi))
其中,PLF()为整合lossi与PF(pi)的复合函数;
将所述总体损失中每一数据对应的分类概率向量的损失与所述总体统计惩罚项中每一数据在分类算法CA下的分类惩罚矩阵进行整合,得到带统计惩罚项的损失函数,具体公式如下:
PL=PLF(Loss,PF(p))
其中,PL为带统计惩罚项的损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江长兴笛卡尔科技有限公司,未经浙江长兴笛卡尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811033070.1/1.html,转载请声明来源钻瓜专利网。