[发明专利]一种基于多源实例迁移学习的恐怖行为预测方法在审
申请号: | 201510246797.8 | 申请日: | 2015-05-14 |
公开(公告)号: | CN104899430A | 公开(公告)日: | 2015-09-09 |
发明(设计)人: | 薛安荣;陈泉浈 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 实例 迁移 学习 恐怖 行为 预测 方法 | ||
1.一种基于多源实例迁移学习的恐怖行为预测方法,其特征在于,包括以下步骤:
步骤1,背景数据的预处理:背景数据由背景知识和行为知识构成,标记为向量对(CS,AS),其中CS=(C1,C2,...,CM)表示背景数据中的背景属性,AS=(A1,A2,...,AN)表示背景数据中涉及的行为属性,为了在组织间实现迁移,对背景数据进行预处理,将多个行为属性合并为一个行为属性,形成(CS,A)的数据集,其中A=A1||A2||...||AN为合并的行为属性;
步骤2,训练候选预测模型:通过步骤1得到形如(CS,A)的源组织和目标组织样本集,对多个源组织样本集分别同目标组织样本集取并集,在每个并集上采用SVM进行迭代的训练,每次迭代训练中都对错分样本进行权重修正,进而得到候选预测模型集;
步骤3,集成最终预测模型:过滤步骤2得到的候选预测模型集中对于目标数据集的误差超过阈值的部分,剩余的模型以加权投票的方式实现行为预测。
2.根据权利要求1所述的基于多源实例迁移学习的恐怖行为预测方法,其特征在于,在步骤2中,训练候选预测模型具体包括以下步骤:
步骤2.1,初始化源组织和目标组织的权重向量其中为第k个源组织样本权重向量,为目标组织的样本权重向量,为了避免权重不匹配问题,对目标组织样本赋予较高的权重;
步骤2.2,对于第一个源组织样本集同目标组织样本集DT取并集在上进行迭代的训练得到第一个源组织的候选预测模型;
步骤2.3,对所有源组织完成了迭代的训练得到候选预测模型集G。
3.根据权利要求2所述的基于多源实例迁移学习的恐怖行为预测方法,其特征在于,在步骤2.2中,迭代的训练包括以下步骤:
S1,对的样本权重向量
S2,根据归一化后的权重分布采用SVM分类算法在上训练分类预测模型h:C→A;
S3,利用公式计算h在目标组织样本集DT上的误差ε;
S4,设
S5,设αT=ε/(1-ε),为了保证αT>1,所以ε必须小于0.5,利用公式修正目标组织样本权重WT;
S6,记录预测模型已经对应的误差F←(h,ε)完成第一轮迭代,并根据修正后的样本权重进行第二轮迭代,直至导致最大迭代次数M;
S7,根据公式得到该源组织的候选预测模型,根据公式得到候选预测模型在DT上的平均误差,记录候选预测模型和平均误差G←(hsum,εavg)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510246797.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新型贴片头机构
- 下一篇:一种板料加工中工位转换用定位移动夹具
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用