[发明专利]一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法有效

专利信息
申请号: 201810453513.6 申请日: 2018-05-14
公开(公告)号: CN108764537B 公开(公告)日: 2021-11-23
发明(设计)人: 傅晨波;郑永立;赵明浩;宣琦 申请(专利权)人: 浙江工业大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/00;G06K9/62
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 tradaboost 算法 社区 标签 发展趋势 预测 方法
【权利要求书】:

1.一种基于A-TrAdaboost算法的多源社区标签发展趋势预测方法,其特征在于,所述方法包括如下步骤:

步骤1:构建问答社区中标签网络,如果同一个问题帖子下边出现多个标签,则认为这些标签具有连边,构建问答社区标签网络,统计其社区中所有的新标签,按时间排序,取比例为前α=10%中的新标签中最后一个标签出现的时刻社区所有标签的网络,作为该社区的网络结构得到源领域和目标领域社区的网络结构集合

步骤2:计算各社区中网络结构的向量表征,采用graph2vec的方法,提取网络Gi的根子图结构,利用Weisfeiler-Lehman核方法对网络Gi中每一个节点依次提取最小子图结构,集合为vi表示网络Gi中的子图的种类,然后利用类比doc2vec的方法中的skip-gram的语言嵌入模型,学习得到源领域社区和目标社区网络图结构的向量表征和VT,t∈{1,2,…,n}。

步骤3:计算源领域与目标领域之间的结构相似性,计算源领域网络结构表征向量和和目标领域VT之间的余弦相似性γt

步骤4:构建基于A-TrAdaboost算法的多源社区标签流行性预测模型,通过提取源领域和目标领域DT中的样本标签及特征数据,把步骤3中计算的相似性γt作为各源领域迁移到目标领域上的初始权重,通过有权SVM的方法,不断迭代更新不同训练样本中的权重,得出最后的训练模型;

所述步骤4中,构建基于网络结构相似性的A-Tradaboost算法模型,操作如下,获取所有源领域和目标领域社区的特征标记样本DS和DT,其中为目标领域有标记数据集,为目标领域无标记数据集,选择源领域数据和目标领域有标记样本数据集作为模型的训练集测试集为c(x)函数表示样本x的标记函数,c(x)∈{0,1},将步骤3所计算的余弦相似性γt分别作为源领域中样本的权重中样本的初始权重设为1,记为wT,即所有训练样本权重为作为A-TrAdaboost方法的初始权重,在每次迭代过程中,通过有权SVM训练每次的基分类器ft,然后根据公式计算每次迭代后在目标领域有标记样本上的误差率εt

其中,βt表示为当前的基分类器的权重,再根据误差率更新训练样本的权重,

使得对目标领域有益的样本权重增加,反之权重降低,迭代N次后,对最后得到的N个基分类器{f1,f2,…,fN}进行加权投票得出最后的出最后的预测模型fT

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810453513.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top