[发明专利]互联网虚拟身份特征信息的获取方法及装置在审

专利信息
申请号: 201410542735.7 申请日: 2014-10-14
公开(公告)号: CN104298751A 公开(公告)日: 2015-01-21
发明(设计)人: 刘广建;李小宜 申请(专利权)人: 李小宜
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 胡海国
地址: 518000 广东省深圳市福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 互联网 虚拟 身份 特征 信息 获取 方法 装置
【权利要求书】:

1.一种互联网虚拟身份特征信息的获取方法,其特征在于,包括:

利用网络采集工具采集互联网虚拟身份的网络数据源;

对采集的网络数据源进行分析识别,并针对不同的互联网虚拟身份标注相应的主题信息,获取互联网虚拟身份的特征信息。

2.根据权利要求1所述的方法,其特征在于,所述利用网络采集工具采集互联网虚拟身份的网络数据源的步骤包括:

通过网络采集工具获取互联网虚拟身份的上网行为数据、内容数据及虚拟身份数据,其中,所述网络采集工具为基于增量学习的主题爬虫,其每次爬行过程均基于以往爬行的知识库,依次进行不断的增量学习;

根据所述上网行为数据、内容数据及虚拟身份数据,形成互联网虚拟身份的网络数据源。

3.根据权利要求2所述的方法,其特征在于,所述对采集的网络数据源进行分析识别,并针对不同的互联网虚拟身份标注相应的主题信息的步骤包括:

基于多分类器集成技术对所述网络数据源进行分析,挖掘获取所述网络数据源的多侧面数据;

根据所述多侧面数据进行主题分类并针对不同的互联网虚拟身份标注相应的主题信息。

4.根据权利要求3所述的方法,其特征在于,所述对采集的网络数据源进行分析识别,并针对不同的互联网虚拟身份标注相应的主题信息,获取互联网虚拟身份的特征信息的步骤之后还包括:

根据标注的主题信息提取不同互联网虚拟身份之间的关系特征;

根据提取的关系特征识别不同互联网虚拟身份组成的虚拟社区;

根据所述虚拟社区提取互联网虚拟身份的社会网络关系特征信息。

5.根据权利要求4所述的方法,其特征在于,所述根据提取的关系特征识别不同互联网虚拟身份组成的虚拟社区的步骤包括:

根据提取的关系特征计算互联网虚拟身份之间的双向意识关系值;

基于双向意识关系值,采用网页排名算法对互联网虚拟身份进行排序,找出网页排名达到预设值的互联网虚拟身份,并形成一互联网虚拟身份种子集合;

根据该互联网虚拟身份种子集合及关联聚类算法识别发现不同互联网虚拟身份组成的虚拟社区。

6.一种获取互联网虚拟身份特征信息的装置,其特征在于,包括:

采集模块,用于利用网络采集工具采集互联网虚拟身份的网络数据源;

标注获取模块,用于对采集的网络数据源进行分析识别,并针对不同的互联网虚拟身份标注相应的主题信息,获取互联网虚拟身份的特征信息。

7.根据权利要求6所述的装置,其特征在于,所述采集模块用于:

通过网络采集工具获取互联网虚拟身份的上网行为数据、内容数据及虚拟身份数据,其中,所述网络采集工具为基于增量学习的主题爬虫,其每次爬行过程均基于以往爬行的知识库,依次进行不断的增量学习;根据所述上网行为数据、内容数据及虚拟身份数据,形成互联网虚拟身份的网络数据源。

8.根据权利要求7所述的装置,其特征在于,所述标注获取模块包括:

挖掘单元,用于基于多分类器集成技术对所述网络数据源进行分析,挖掘获取所述网络数据源的多侧面数据;

标注单元,用于根据所述多侧面数据进行主题分类并针对不同的互联网虚拟身份标注相应的主题信息。

9.根据权利要求8所述的装置,其特征在于,还包括:

虚拟社区识别模块,用于根据标注的主题信息提取不同互联网虚拟身份之间的关系特征,根据提取的关系特征识别不同互联网虚拟身份组成的虚拟社区,并根据所述虚拟社区提取互联网虚拟身份的社会网络关系特征信息。

10.根据权利要求9所述的装置,其特征在于,所述虚拟社区识别模块用于:

根据提取的关系特征计算互联网虚拟身份之间的双向意识关系值;基于双向意识关系值,采用网页排名算法对互联网虚拟身份进行排序,找出网页排名达到预设值的互联网虚拟身份,并形成一互联网虚拟身份种子集合;根据该互联网虚拟身份种子集合及关联聚类算法识别发现不同互联网虚拟身份组成的虚拟社区。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李小宜,未经李小宜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410542735.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top