[发明专利]一种基于微博标签的人群画像系统和方法有效
申请号: | 201310481674.3 | 申请日: | 2013-10-16 |
公开(公告)号: | CN103577549B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 阳德青;肖仰华;汪卫 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,王洁平 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于无线通信网络技术领域,具体为一种基于微博标签的人群画像系统和方法,本发明系统包含微博标签推荐和标签主题聚类两大模块,其中第一模块中采用一个涵盖三个步骤的标签推荐算法。第一步为同质性标签推荐,第二步为共现性标签扩展;第三步则是以中文知识图谱为基础建立语义网络,利用网络拓扑特性来度量标签之间的语义相似度,从而去除语义相同或相似的标签,保证用来刻画用户的标签精炼性。本发明利用微博用户标签具有广泛的商业应用价值,同时也为互联网用户标签的挖掘算法和中文知识图谱的应用指明了研究方向。 | ||
搜索关键词: | 一种 基于 标签 人群 画像 系统 方法 | ||
【主权项】:
一种基于微博标签的用户人群画像方法,其特征在于其通过为微博用户推荐标签来精准刻画用户的属性特征,并利用LDA工具分析用户标签的主题分布后准确地判断用户所属的人群;具体步骤如下:(1)分别利用微博用户的同质性和标签的共现性关联来推荐产生候选的标签,再利用中文知识图谱识别标签的语义冗余,进而消除候选标签中的冗余标签,实现微博用户标签推荐;(2)对推荐出的每一个微博用户的标签进行LDA主题聚类分析,获得每个用户的主题分布向量,由此判断用户所属的人群以及度量用户间的差异性距离以刻画不同用户群体的特征,实现用户人群画像;其中:步骤(1)中消除候选标签中的冗余标签步的方法具体如下:通过建立中文知识图谱,将百科类网站的词条映射成语义网络中的结点,词条间的超链接映射出网络边,使得网络的拓扑结构可以度量标签的语义范畴,从而判断出候选推荐的标签中是否存在语义冗余。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310481674.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种定时宠物喂食装置
- 下一篇:半导体器件制造方法