[发明专利]一种由不实信息驱动的社交网络主题专家查找方法有效
申请号: | 201811105652.6 | 申请日: | 2018-09-20 |
公开(公告)号: | CN109271422B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李国徽;董明;周全;李剑军 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q50/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 不实 信息 驱动 社交 网络 主题 专家 查找 方法 | ||
本发明公开了一种由不实信息驱动的社交网络主题专家查找方法,包括:利用社交网络数据集,构建候选用户文档,利用候选用户文档和待查询不实信息,构建概率图模型;利用候选用户文档和待查询不实信息训练概率图模型,当概率图模型的参数收敛后,得到维度相同的候选用户向量和待查询不实信息向量;通过计算候选用户向量和待查询不实信息向量的余弦距离,得到候选用户和待查询不实信息的相似度,利用相似度得到查询结果。本发明很好的应对社交网络情形,应对包含多个主题的不实信息,考虑了社交网络中用户之间存在的联系。
技术领域
本发明属于信息检索领域,更具体地,涉及一种由不实信息驱动的社交网络主题专家查找方法。
背景技术
随着互联网技术尤其是Web2.0技术以及无线通信技术的不断发展,我国互联网用户人群急剧增长,根据中国互联网络信息中心(CNNIC)发布的第39次《中国互联网络发展状况》统计报告显示,截至2016年12月,中国互联网普及率达到53.2%,网民规模达7.31亿,相当于整个欧洲人口总量。海量互联网用户促进了各种社交应用的蓬勃发展,如微博社交网络(Twitter、新浪微博等)。截至2016年8月,新浪微博月活跃用户为2.82亿,连续九个季度保持30%以上的增长,其中移动端月活用户同比增长40%。新浪微博作为中国社交网络最具代表性的应用之一,在移动互联网蓬勃发展的背景下也迅速成长,截至2016年8月,新浪微博月活跃用户为2.82亿,连续九个季度保持30%以上的增长,其中移动端月活用户同比增长40%。然而,高速发展的微博平台同样为谣言传播提供了环境,针对微博中可疑信息甄别问题已在社会学范畴被广泛研究,其能够有效帮助微博管理者实时准确的甄别大规模的可疑信息,以减少谣言传播过程所带来的额外存储开销以及严重的社会危害性,因此该问题具有十分重要的研究意义及商业价值。
社交媒体较传统的互联网应用,其信息的传播方式发生了前所未有的变化,个人用户可以自由公开地在网络上发布、传播和获取自己感兴趣的信息,因此其具有传播速度快,影响人群广,用户交互频繁等特性,从而在短期内产生了海量的用户数据,其内容涵盖不同领域的各种专业知识,如航天航空、生物医药、电子科技、互联网金融等。
微博用户数据具有信息网络化、内容碎片化、线上线下交融等新特点,同时也为数据挖掘与知识检索提供了前所未有的机遇。然而,拥有庞大用户群体的社交网络也为谣言(谣言通常是指为达到某种目的而编造出来与事实不符的虚假信息,并通过某种方式快速传播且造成一定社会危害的言论)的传播和扩散提供了土壤和媒介。借助这种新的传播媒介,谣言比以往传播速度更快、影响范围更广、监测难度更大且危害程度更深。在此种背景下,谣言的产生和传播不仅妨碍了社交媒体中知识的有效利用,而且容易造成严重的社会危害,甚至为互联网犯罪提供方便,从而严重影响了现代社会的经济发展和稳定。例如,2017年2月9日,社交网络上传播的“胶济铁路列车相撞事件”引起了社会的广泛关注以及公众对铁路安全的质疑,但经过核实此消息为谣言。类似案例层出不穷,造成了严重的社会危害和无法估量的经济损失。因此,如何在现代社交网络中及时准确地监测和识别谣言具有重要的研究价值和社会意义,其能够有效限制谣言传播,从而最大化的减少其造成的社会危害和经济损失。
传统的专家查找技术通常应用于企业文档集合,无法很好的应对社交网络情形,更无法应对包含多个主题的不实信息。传统的语言模型LDA模型通常认为文档之间是相互独立的,忽视了社交网络中用户之间存在的联系。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种由不实信息驱动的社交网络主题专家查找方法,由此解决现有技术无法很好的应对社交网络情形,更无法应对包含多个主题的不实信息,忽视了社交网络中用户之间存在的联系的技术问题。
为实现上述目的,本发明提供了一种由不实信息驱动的社交网络主题专家查找方法,包括:
(1)利用社交网络数据集,构建候选用户文档,利用候选用户文档和待查询不实信息,构建概率图模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811105652.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置