[发明专利]面向深度迁移学习的去偏方法及其装置在审
申请号: | 202110649889.6 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113298254A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈晋音;陈奕芃;陈一鸣 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 深度 迁移 学习 偏方 及其 装置 | ||
1.一种面向深度迁移学习的去偏方法,其特征在于,包括以下步骤:
获取源域数据集和目标域数据集,提取类别标签和敏感属性标签;
构建全连接神经网络作为迁移模型的教师模型,采用源域数据集优化教师模型的网络参数;
固定参数优化的教师模型的前n层全连接层的网络参数不变作为特征提取器,并在教师模型的最后一层添加m层全连接层,形成迁移模型的学生模型,采用目标域数据集优化学生模型的网络参数;
在参数优化的学生模型的特征提取器的输出添加注意力机制层,用于从特征提取器中的输出特征中提取敏感属性并确定敏感属性的权重;
将敏感属性对应的特征向量与其他特征向量进行正交操作,以去除深度迁移学习的敏感属性带来的偏见。
2.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,源域数据集采用Credit数据集,目标域数据集采用Census数据集,敏感属性为性别属性。
3.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,所述类别标签采用one-hot编码。
4.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,所述教师模型采用由5层全连接层组成的全连接层神经网络,n为3,m为2。
5.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,所述教师模型采用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数。
6.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,所述学生模型采用SoftMax为激活函数对数据进行分类识别,训练过程的损失函数均使用交叉熵损失函数。
7.如权利要求1所述的面向深度迁移学习的去偏方法,其特征在于,迁移模型训练结束后,利用测试集测试迁移模型的公平性,其机会平等的公式为:
其中表示迁移模型的预测的分类结果,Y和y为真实分类标签,A为敏感属性,当上式的左右两边的结果相等或相近时则认为模型达到了去偏效果。
8.一种面向深度迁移学习的去偏装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于,所述计算机处理器执行所述计算机程序时实现权利要求1~7任一项所述的面向深度迁移学习的去偏方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110649889.6/1.html,转载请声明来源钻瓜专利网。