[发明专利]基于改进人工免疫系统的链接预测方法及存储介质在审
申请号: | 201811580829.8 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109636057A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 王萌萌;张峰;葛建军 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/00 |
代理公司: | 北京中知法苑知识产权代理事务所(普通合伙) 11226 | 代理人: | 李明 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 链接 人工免疫系统 存储介质 链接特征 用户动态 构建 权重 亲和力 预测 标准正态分布 网络结构信息 改进 变异因子 发布内容 关系特征 内容信息 人工免疫 时间序列 训练集合 用户发布 预测模型 重新定义 度量 算法 多样性 赋予 分析 | ||
一种基于改进人工免疫系统的链接预测方法及存储介质,所述方法首先基于用户网络结构信息和用户发布内容信息的时间序列,构建用户动态关系特征和用户动态发布内容特征;通过对链接特征进行相关性分析,根据特征的重要性赋予其权重以得到带有权重的训练集合;最后,通过重新定义亲和力度量标准、多样化的亲和力阈值以及标准正态分布变异因子,构建基于改进的人工免疫算法的链接预测模型。本发明不仅能够较好地适用于链接特征的多样性,还能够使系统保持较高的准确性,实现了链接存在性及方向性的预测。
技术领域
本发明涉及网络链接预测技术领域,特别涉及一种基于改进的人工免疫系统的链接预测方法。
背景技术
社会网络可以看作是一种以节点表示个体或其他实体,以边来表示节点间的交互或关系的图结构。基于这种关系结构,大量个体围绕着某个事件进行交互并彼此影响,其中,个体发表文本信息的可见性和真实关系的不易见性,使得利用动态交互网络预测网络结构成为当前的研究热点。作为关系结构分析中最为基础的问题,链接预测具有广泛的实际应用价值,其不但能够分析社会网络中的缺失数据,而且可被应用到其他领域,如分子生物学、犯罪调查、信息检索和推荐系统。此外,对链接预测方法的研究还有助于深入理解社会网络的演化机理。综上所述,除广阔的应用前景外,链接预测还具有重要的理论意义。
近年来,研究者提出了很多解决链接预测的相关算法,这些算法一般是基于监督学习的链接预测、基于概率模型的链接预测、基于节点相似度的链接预测等。
基于节点相似度的链接预测。根据预先设定的相似度评分函数对节点间的相似度进行打分,然后根据打分值将所有没被发现的链接进行排序,相似度分数越高则两节点间存在链接的可能性越大。该方法仅考虑网络拓扑结构,而忽略了网络其他因素,例如时间因素,从而导致预测结果差强人意。
基于概率模型的链接预测。首先利用社会网络中的节点或者边构造一个统计模型,然后利用该统计模型进行链接预测。统计模型构建是该方法的核心,将直接影响后续链接预测的结果。该方法主要存在两点缺点:一是获取节点信息的难度很大,无法获得足够的先验知识,因此统计模型构建非常困难;二是算法的复杂性较高,因此在实际应用中具有一定难度。
基于监督学习的链接预测。根据已知的网络信息获取链接关系,并在这些链接关系中提取相关的特征属性构建分类器,然后根据该分类器对未知网络进行二类划分,即判断链接关系存在或者不存在。该方法的主要缺点是社会网络中的节点不是简单的统计上的独立采样点,节点间存在着联系,并不满足传统的机器学习条件。
综上所述,动态社会网络中关于有向链接预测的研究目前还处于起步阶段,很多问题的提出及研究方法都源于静态网络和无向网络,如何对链接的方向性和网络的动态性加以考虑、如何量化不同链接特征的重要性以及如何合理地融合多维特征成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于提出一种基于改进的人工免疫系统的链接预测方法,以克服现有技术中存在的忽视链接方向性和网络动态性、不同链接特征重要性的量化不合理以及多维特征融合复杂度过高的缺陷,进而提高动态社会网络中有向链接预测的精度。
为达此目的,本发明采用以下技术方案:
一种基于改进人工免疫系统的链接预测方法,包括如下步骤:
特征表示步骤S110:
通过社交媒体获取用户的个人特征信息、基于时间片流的用户关系特征信息,和用户发表状态信息,利用上述信息解析得到用户概要特征,用户动态关系特征和用户动态发表内容特征;
特征参数学习步骤S120:针对特征表示步骤中得到的三类特征,分析各个特征与链接关系的相关性,删除相对冗余的特征,计算并分配剩余特征的权重,所述链接关系位于不同用户之间,包括三种情况,即用户是否关注另一用户,用户是否被另一用户所关注,以及两个用户之间不存在任何关注关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811580829.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理