[发明专利]一种基于多维度的网络空间人物画像方法在审
申请号: | 202110286268.6 | 申请日: | 2021-03-17 |
公开(公告)号: | CN115114498A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 彭媛媛;张海霞;连一峰;黄克振;刘倩 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 网络 空间 人物 画像 方法 | ||
1.一种基于多维度的网络空间人物画像方法,其步骤包括:
1)构建网络空间的人物画像体系,所述人物画像体系包括人物的基本信息、个人经历、社交信息、用户标签和社会关系;
2)对于一目标人物,从百度百科、维基百科爬取该目标人物的基本信息和社交信息;然后从社交信息中获取该目标人物的社交账号和关联人物,并根据社交账号从社交媒体采集该目标人物的用户注册信息、关注与被关注信息、用户发布信息和关注粉丝信息,用于补充该目标人物的社交信息;然后根据该目标人物在社交账号中的相关信息计算该目标人物的社交影响指数;
3)依据该目标人物的姓名、所在单位搜集人物简历,获取该目标人物的个人经历;
4)利用该目标人物的年龄阶段、职业所涉及行业作为目标人物标记身份标签;
5)根据该目标人物在社交媒体Twitter中发布的消息数量,计算社交媒体Twitter相对于该目标人物的权重γTwitter,并计算该目标人物在社交媒体Twitter中发布的消息中词语的TF-IDF值,选取TF-IDF值靠前的N个词语Twitter_Words(w1,w2,…,wN),然后将所选N个词语的TF-IDF值与权重γTwitter相乘,得到更新后的词语TF-IDF值;
6)根据该目标人物在微博中发布的消息数量,计算微博相对于该目标人物的权重γWeibo,并计算该目标人物在微博中发布的消息中词语的TF-IDF值,选取TF-IDF值靠前的N个词语Weibo_Words(w1,w2,…,wN);然后将所选N个词语的TF-IDF值与权重γWeibo相乘,得到更新后的词语TF-IDF值;
7)根据步骤5)、6)所得更新后的词语TF-IDF值对词语进行排序,选取TF-IDF值靠前若干词语作为该目标人物的兴趣标签。
2.如权利要求1所述的方法,其特征在于,计算该目标人物的用户社交影响力的方法为:
2-1)根据该目标人物的社交信息计算用户消息参与度其中n代表该目标人物最近一段时间T内发布的消息数量,SpreDegreei代表第i条消息的传播度,CoNumi代表第i条消息的评论数量,SuNumi代表第i条消息的点赞数量;
2-2)计算该目标人物的粉丝的认证情况和最新动态评估得出该目标人物的活跃粉丝数ActiveFan′;
2-3)根据该目标人物在Twitter和微博中的属性信息计算得出该目标人物的用户可信度Reliability;
2-4)利用层次分析法计算该目标人物的用户消息参与度Participation、活跃粉丝数ActiveFan′、可信度Reliability相对用户影响的权重,分别为wpar,wfan,wrel;
2-5)计算该目标人物的在Twitter、微博的影响力Influencet∈{Twitter,Weibo}=wpar×Participation+wfan×ActiveFan′+wrel×Reliability;
2-6)基于D-S理论构建用户社交影响指数评估框架,将该目标人物在Twitter和微博中的影响力分别做归一化处理后作为用户社交影响指数评估框架的基本信任分配;
2-7)利用D-S理论中的合成法则分别对该目标人物在社交媒体Twitter下的基本信任与该目标人物在微博下的基本信任进行合成,将合成后的结果作为该目标人物的用户社交影响指数Influence。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110286268.6/1.html,转载请声明来源钻瓜专利网。