[发明专利]半监督学习系统及半监督学习方法在审
申请号: | 202011558918.X | 申请日: | 2020-12-25 |
公开(公告)号: | CN114692887A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 黄咏舜;苏育正;张晋维 | 申请(专利权)人: | 台达电子工业股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 李琛;黄艳 |
地址: | 中国台*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 学习 系统 学习方法 | ||
1.一种半监督学习系统,包括:
一非易失性存储器,用以存储一半监督学习应用程序;以及
一处理器,用以执行该半监督学习应用程序以执行下列步骤:
取得一或多个源域的源域数据及一目标域的目标域数据;
使用该源域数据及该目标域数据以训练一特征萃取模型;
利用一域判别模型、一任务模型及一半监督学习机制以分别计算该特征萃取模型的域判别损失函数、任务损失函数及半监督损失函数;
依据该域判别损失函数、该任务损失函数及该半监督损失函数以计算一总损失函数,并依据该总损失函数以更新相应于该特征萃取模型、该任务模型及该域判别模型的第一权重、第二权重及第三权重;以及
因应于一整体模型满足模型收敛条件,结束该整体模型的训练过程,其中该整体模型包括该特征萃取模型、该任务模型及该域判别模型。
2.如权利要求1所述的半监督学习系统,其中该特征萃取模型为ResNet50模型,该半监督学习机制为一致性正规化的未监督数据增强机制,该任务模型为一第一全连接层,且该域判别模型为一第二全连接层加上一梯度反转层。
3.如权利要求1所述的半监督学习系统,其中该处理器分别指派第一超参数、第二超参数及第三超参数至该域判别损失函数、该任务损失函数及该半监督损失函数以计算该总损失函数。
4.如权利要求3所述的半监督学习系统,其中该源域数据包括第一已标签数据及第一未标签数据,且该目标域数据包括第二已标签数据及第二未标签数据,
其中,该处理器是使用该第一已标签数据、该第一未标签数据、该第二已标签数据及该第二未标签数据以计算该域判别损失函数,并依据该域判别损失函数以更新该特征萃取模型及该域判别模型的该第一权重,
其中,该处理器使用该第一已标签数据及该第二已标签数据以计算该任务损失函数,并依据该任务损失函数以更新该特征萃取模型的该第一权重及该任务模型的该第二权重,
其中,该处理器使用该第一未标签数据及该第二未标签数据以计算该半监督损失函数,并依据该半监督损失函数以更新该特征萃取模型的该第一权重。
5.如权利要求2所述的半监督学习系统,其中该模型收敛条件表示该整体模型在固定训练批次或固定训练时间或该总损失函数达到目标值。
6.一种半监督学习方法,包括:
取得一或多个源域的源域数据及一目标域的目标域数据;
使用该源域数据及该目标域数据以训练一特征萃取模型;
利用一域判别模型、一任务模型及一半监督学习机制以分别计算该特征萃取模型的域判别损失函数、任务损失函数及半监督损失函数;
依据该域判别损失函数、该任务损失函数及该半监督损失函数以计算一总损失函数,并依据该总损失函数以更新相应于该特征萃取模型、该任务模型及该域判别模型的第一权重、第二权重及第三权重;以及
因应于一整体模型满足模型收敛条件,结束该整体模型的训练过程,其中该整体模型包括该特征萃取模型、该任务模型及该域判别模型。
7.如权利要求6所述的半监督学习方法,其中该特征萃取模型为ResNet50模型,该半监督学习机制为一致性正规化的未监督数据增强机制,该任务模型为一第一全连接层,且该域判别模型为一第二全连接层加上一梯度反转层。
8.如权利要求7所述的半监督学习方法,还包括:分别指派第一超参数、第二超参数及第三超参数至该域判别损失函数、该任务损失函数及该半监督损失函数以计算该总损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于台达电子工业股份有限公司,未经台达电子工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011558918.X/1.html,转载请声明来源钻瓜专利网。