[发明专利]用于选择识别的消息组的方法、计算机可读介质和计算机有效
申请号: | 201280062968.6 | 申请日: | 2012-11-16 |
公开(公告)号: | CN104011718B | 公开(公告)日: | 2018-01-23 |
发明(设计)人: | 伊川洋平;榎美纪;R.H.P.鲁迪;那须川哲哉 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 胡琪 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 社交 媒体 中的 趋势 方法 计算机 程序 | ||
技术领域
本发明涉及一种信息处理技术,并且更具体地,其涉及一种用于更快速和更精确地检测社交媒体中的突发信息(以不同于正常的规模散布的信息)的技术。
背景技术
存在一种现象,其中当自然灾害或重要社会问题出现时,社交媒体上的信息以极快的速度和庞大的规模散布,并且该现象有时被称为“突发(burst)”现象。在这种突发信息中包括了与事实不同的信息(例如错误信息、谣言)并且取决于情况该信息可能成为企业活动的威胁。因此,寻求可以快速和精确地检测“突发”现象的技术。
响应于该需要,提供了各种先前的技术。作为示例,在专利文献1中,对于称为“提供能够从网络上公开的信息取得谣言信息,同时提取与这种谣言信息相关的信息,并且同时将其呈现给用户的技术”的问题,提供了一种技术,其“包括数据收集装置,用于接收由网络上的服务器设备公开的数据,以及用于在收集数据存储器装置中将所述数据存储为各种收集数据;谣言信息判断装置,用于提取包括在收集数据中的字符串,并且用于基于字符串获得收集数据是否是谣言信息的判断结果;相关信息数据提取装置,用于从网络上的服务器设备或从预先累积的相关信息数据库提取被判断为谣言信息的谣言信息数据和至少是谣言信息数据的作者、或谣言信息数据的内容、或存储数据的服务器设备的名称或网络地址或者谣言信息数据的文件信息的相关信息数据;以及输出装置,用于同时输出谣言信息数据和相关信息数据。”此外,在非专利文献1中,提供了一种用于通过评估关键字的增加程度而检测信息是否是突发信息的技术。
引用列表
背景技术
专利文献
专利文献1:日本公开待审No.2008-165598
非专利文献
非专利文献1:
J.Kleinberg:Bursty and Hierarchical Structure in Streams,Proceeding of the8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,(2002).
发明内容
技术问题
然而,存在改进快速和精确地检测“突发”现象的空间。
本发明考虑了这种现象,并且其目的是提供能够通过考虑发送信息的人和信息的内容的特征而快速和精确地检测“突发”现象的技术。
问题的解决方案
具体地,通过发明人的研究,在获得下列知识之后创造出本发明:1.散布可能性根据发送用户的影响程度而不同(由高影响力的用户发送的信息更可能被重新发送)。2.散布可能性根据用户重新发送的频率而不同(对于经常重新发送的用户和很少重新发送的用户重新发送的重要性不同)。3.重新散布可能性根据信息的独特性而不同(当重新发送的信息的内容不同于正常时,信息散布可能性高)。
具体地,本发明提供一种用于通过使用计算机从由多个用户通过社交网络发送的多个消息选择识别的消息组的方法。在消息内,包括由与原始消息用户不同的用户发送的消息,并且这些消息引用由原始消息用户发送的消息。所述方法包括下列步骤:对于由与原始消息用户不同的用户发送的引用由原始消息用户发送的消息的消息,执行进一步重新发送的可能性的初级评估;识别已经发送了初级评估结果高于预定第一阈值的消息的单个用户;基于引用由单个用户发送的消息的重新发送消息组,识别与重新发送消息组相似的消息组;执行将进一步重新发送相似消息组的可能性的次级评估;以及选择次级评估结果高于预定第二阈值的消息组。
这里,在执行初级评估和次级评估的步骤,可以作为其他用户的影响力的递增函数而计算进一步重新发送的可能性。更具体地,可以作为关注其他用户的用户数量的递增函数而计算其他用户的影响力程度。此外,在执行初级评估和次级评估的步骤,可以作为其他用户过去重新发送引用第一用户的消息的消息的程度的递减函数而计算进一步重新发送的可能性。更具体地,可以作为在过去固定时段内其他用户重新发送引用第一用户的消息的消息的次数而计算已重新发送的程度。此外,在执行初级评估和次级评估的步骤,可以作为由其他用户重新发送的消息内容和由其他用户过去进一步重新发送的消息的相似度的递减函数而计算进一步重新发送的可能性。更具体地,可以通过将由其他用户重新发送的消息和由其他用户过去进一步重新发送的消息进行文本串匹配而计算相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280062968.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制冷装置和方法
- 下一篇:燃气涡轮发动机中的催化燃烧器