[发明专利]舆情数据角色识别中异构关系数据的迁移学习界限的确定方法在审
申请号: | 201811547552.9 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109657159A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 何慧;张伟哲;方滨兴;邰煜;赵蕾;杨洪伟 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35;G06N20/00;G06Q50/00 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 舆情数据角色识别中异构关系数据的迁移学习界限的确定方法,涉及迁移学习技术领域。为了解决现有技术没有联合两个领域的数据进行学习再运用到目标域中,分类效果不准确的问题。定义度量两个异构领域间差异的散度,利用它求出均来自同一个抽象假设类A的两个领域的经验距离并给出将两个类转化到同一个特征空间下的算法,给出经验距离和真实距离之间的差异界限,给出最小化目标域误差的界限,最终又给出泛化能力最强并结合源域和目标域训练数据的泛化误差,通过最小化联合误差来得到目标域误差的界限。所得出的界限保证在目标域标记数据很少的情况下也能得到一个合理的界限值。适用于公共大数据及新媒体数据平台中的各种识别问题。 | ||
搜索关键词: | 目标域 异构 关系数据 角色识别 迁移 最小化 学习 标记数据 定义度量 分类效果 数据平台 特征空间 训练数据 大数据 类转化 新媒体 散度 算法 源域 抽象 联合 保证 | ||
【主权项】:
1.一种舆情数据角色识别中异构关系数据的迁移学习界限的确定方法,其特征在于,所述方法的实现过程为:首先定义度量两个异构领域间差异的散度,用散度来度量两个领域间的距离,然后利用两个领域的有限样本和异构数据转同构算法给出域间经验距离,并且求出经验距离与理论距离之间的差距;为求出目标域的分类误差,则需要考察两个不同的分类器分别在源域和目标域上的表现,然后利用三角不等式和已求得的差距尾项即可得到目标域的分类误差界限;最后,扩展已有的界限,将源域和目标域的样本融合起来进行学习之后对目标域进行分类,得到泛化的目标域分类误差界限。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811547552.9/,转载请声明来源钻瓜专利网。