[发明专利]用于跟踪网络中的主题随时间的演变的方法、系统和介质有效
申请号: | 201910456877.4 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110555454B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | M·E·赫兰德;E·A·雷;N·莱蒂夫;J·S·B·T·玛丽亚;K·R·瓦什奈伊;L·莱巴 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F18/22 | 分类号: | G06F18/22;G06F16/36;G06F16/953 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;彭梦晔 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 跟踪 网络 中的 主题 随时 演变 方法 系统 介质 | ||
本发明涉及一种从上下文数据跟踪主题排名的演变。公开了系统、方法和计算机程序产品,其通过分析每个时间片与网络的节点相关联的媒体语料库来跟踪网络随时间的演变。可以分析媒体语料库以生成每个时间片的字簇,然后跨时间片对字簇进行比较以确定网络如何演变。可以通过确定特定时间片的每个字簇与另一时间片的每个字簇的相似性来跟踪演变。可以通过每个比较的相似性得分来测量相似性,可以组合相似性得分以确定两个时间片之间的网络的整体相似性。
背景技术
本公开涉及用于基于主题与网络中的重要节点的连接来跟踪网络中的主题随时间的演变的系统和方法。
在网络上发现的各种主题的流行度可能随时间而改变。例如,诸如新闻报道、政府声明、国内或国际事件、电影、新技术或其他类似主题等主题可以随着时间的推移在网络中经历增加或减少的曝光。
发明内容
本文中描述的系统、方法和计算机程序产品提供对网络中的主题随时间的演变的跟踪。
在本公开的一个方面,公开了一种方法,其包括接收与网络相关联的时间序列数据,该时间序列数据包括在多个时间片的关于网络的数据。网络在每个时间片包括多个节点,其中在每个时间片的每个节点包括与至少一个媒体语料库相关联的属性。该方法还包括分析时间序列数据以针对每个时间片在网络中标识至少一个最重要节点,基于在每个时间片的所标识的至少一个最重要节点确定在每个时间片的网络的子网,其中子网包括网络的节点中的至少一些节点和所标识的至少一个最重要节点,分析与在每个时间片的子网中的每个节点的属性相关联的至少一个媒体语料库以确定针对该时间片的至少一个关键字簇,其中每个关键字簇包括多个关键字,将多个时间片中的第一时间片的至少一个关键字簇与多个时间片中的第二时间片的至少一个关键字簇进行比较,并且基于该比较确定第一时间片与第二时间片之间的相似性。
在本公开的各方面,还可以提供根据以上方面的装置、系统和计算机程序产品。在不脱离本公开的范围的情况下,可以组合任何上述方面。
附图说明
通过参考附图可以理解关于本公开的结构和操作的细节,附图中的相同的附图标记和名称指代相同的元素。
图1是示出根据本公开的一些方面的用于跟踪网络中的主题演变的系统的系统图。
图2是根据本公开的一些方面的网络的时间序列的图。
图3A是示出根据本公开的一些方面的网络随时间的演变的图。
图3B是示出根据本公开的一些方面的最重要子网随时间的演变的图。
图3C是示出根据本公开的一些方面的网络中的字簇随时间的演变的图。
图4是根据本公开的一些方面的时间片之间的关键字簇的演变的图。
图5是根据本公开的一些方面的示例网络的图。
图6是图5的示例网络的图,其示出了根据本公开的一些方面的最重要节点的标识。
图7是根据本公开的一些方面的两个字簇的图。
图8是根据本公开的一些方面的包括字簇到节点的链接的图5的示例网络的图。
图9是图8的示例网络的图,其示出了根据本公开的一些方面的网络中的字簇随时间的演变。
图10是根据本公开的一些方面的包括所预测的错误发生的网络的时间序列的图。
图11是本文中描述的系统、方法和计算机程序产品中涉及的过程可以在其中实现的计算机系统的示例框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910456877.4/2.html,转载请声明来源钻瓜专利网。