[发明专利]基于改进人工免疫系统的链接预测方法及存储介质在审
申请号: | 201811580829.8 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109636057A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 王萌萌;张峰;葛建军 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/00 |
代理公司: | 北京中知法苑知识产权代理事务所(普通合伙) 11226 | 代理人: | 李明 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 链接 人工免疫系统 存储介质 链接特征 用户动态 构建 权重 亲和力 预测 标准正态分布 网络结构信息 改进 变异因子 发布内容 关系特征 内容信息 人工免疫 时间序列 训练集合 用户发布 预测模型 重新定义 度量 算法 多样性 赋予 分析 | ||
1.一种基于改进人工免疫系统的链接预测方法,包括如下步骤:
特征表示步骤S110:
通过社交媒体获取用户的个人特征信息、基于时间片流的用户关系特征信息,和用户发表状态信息,利用上述信息解析得到用户概要特征,用户动态关系特征和用户动态发表内容特征;
特征参数学习步骤S120:
针对特征表示步骤中得到的三类特征,分析各个特征与链接关系的相关性,删除相对冗余的特征,计算并分配剩余特征的权重,所述链接关系位于不同用户之间,包括三种情况,即用户是否关注另一用户,用户是否被另一用户所关注,以及两个用户之间不存在任何关注关系;
链接预测步骤S130:
利用用户概要特征、用户动态关系特征和用户动态发布内容特征,设计面向链接预测的人工免疫系统构成表示;计算每一个抗体的亲和力阈值,对约简后的抗体集合中的每一个抗体进行克隆与变异,并基于构建的人工免疫系统模型进行链接预测。
2.根据权利要求1所述的基于改进人工免疫系统的链接预测方法,其特征在于:
所述社交媒体包括新浪微博、FACEBOOK。
3.根据权利要求1所述的基于改进人工免疫系统的链接预测方法,其特征在于:
在特征表示步骤中,集合表示链接特征,并结合函数描述,给出了链接特征的形式化表示。
4.根据权利要求1所述的基于改进人工免疫系统的链接预测方法,其特征在于:
在特征表示步骤S110中,
用户概要特征包括:互粉数、粉丝数、关注数、性别、省份、城市、账户创建时间和账户认证类型,可选的,具有离散特征的性别、省份、城市、账户创建时间和账户认证类型特征在原始数据集中以不同的数值表示其所属类别;
用户动态关系特征包括:利用改进的Salton度量标准、改进的Jaccard度量标准和改进的Preferential Attachment度量标准,衡量表示用户动态关系特征;
其中所述改进的Salton度量标准为:
在时间片流[0,tn]上,用户u和用户v的Salton值的计算公式如下:
其中,所述的β∈[0,1],βn-i表示时间片ti的权重;n表示时间片流[0,tn]上包含的时间片总数;Sa(u,v,ti)表示用户u和用户v在第i个时间片ti上的Salton值,其计算公式如下:
其中,所述的Γin(u,ti)和Γin(v,ti)分别为用户u和用户v在时间片ti上的入链接用户集合;Γout(u,ti)和Γout(v,ti)分别为用户u和用户v在时间片ti上的出链接用户集合;入链接和出链接由用户间的关注关系决定;|Γ(x)|表示集合Γ(x)的元素数量,din(u,ti)和din(v,ti)分别为用户u和用户v在时间片ti上的入度;dout(u,ti)和dout(v,ti)分别为用户u和用户v在时间片ti上的出度;
所述改进的Jaccard度量标准为:
在时间片流[0,tn]上,用户u和用户v的Jaccard值的计算公式如下:
其中,所述的Ja(u,v,ti)表示用户u和用户v在第i个时间片ti上的Jaccard值,其计算公式如下:
所述改进的Preferential Attachment度量标准为在时间片流[0,tn]上,用户u和用户v的Preferential Attachment值的计算公式如下:
其中,所述的Pa(u,v,ti)表示用户u和用户v在第i个时间片ti上的PreferentialAttachment值,其计算公式如下:
所述用户动态发布内容特征为:统计单一时间片上正向情感统计单一时间片上的正向情感词数和负向情感词数,计算单一时间片上的用户心情指数,并最终计算时间流上的用户心情指数,具体包括
在时间片流[0,tn]上,用户u的动态发布内容特征计算公式如下:
其中,所述的Em(u,ti)表示用户u在时间片ti上的心情指数,即某个用户在时间片ti上发布的微博文本中所表达出的情感,其计算公式如下:
Em(u,ti)=pn(u,ti)/nn(u,ti)
其中,所述的pn(u,ti)和nn(u,ti)分别表示用户u在时间片ti上发表的社交文本集合中使用的包含在中英文情感分析用词语集中的正向情感词数和负向情感词数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811580829.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理