[发明专利]将与搜索查询关联的数据可视化的系统和方法及计算装置在审
申请号: | 202010075015.X | 申请日: | 2020-01-22 |
公开(公告)号: | CN111753152A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 赵健;弗朗辛·陈 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06F16/904 | 分类号: | G06F16/904;G06F16/906;G06F16/9035 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘久亮;黄纶伟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 查询 关联 数据 可视化 系统 方法 计算 装置 | ||
将与搜索查询关联的数据可视化的系统和方法及计算装置。提供了一种将与搜索查询关联的数据可视化的方法和系统。该方法包括以下步骤:接收包括多个数据项的数据集,每个数据项具有关联的等级信息以及指示该数据项与一个或更多个其它数据项之间的相似度的相似度信息;基于所述等级信息来将所述数据集排序成分级列表;基于边界参数来屏蔽所述分级列表的连续部分;基于所述相似度信息来对所述分级列表中的除了被屏蔽的连续部分之外的部分进行迭代聚类,以产生聚类的分级数据列表;以及生成并显示代表所述聚类的分级数据列表的可视化,所述可视化包括代表所述聚类的分级数据列表中的每个集群的成形对象。
技术领域
本公开涉及自动排序分级项并生成分级结果的可视化表示,并且更具体地,涉及对用于有效数据探索的分级项进行层次聚类(hierarchically clustering)的系统和方法。
背景技术
在诸如数据搜索结果显示和数据可视化(visualization)系统的相关技术系统中,层次聚类是用于组织有时使用的数据项的方法。这些相关技术系统中的层次聚类可以产生提供概要的树结构,该概要对于需要理解并导航大型数据集的用户会是有益的。更具体地,在相关技术系统中,可以通过将相似项逐步地分组在一起来生成树结构,其中,叶节点代表原始项并且内部节点(即,集群)代表聚合的项。相关技术方法是凝聚的(自下而上)或分裂的(自上而下)。通过这种层次,相关技术系统的用户可以能够以多尺度方式浏览并总结通常大的整个数据集。
然而,相关技术的层次聚类算法没有将数据项区分开,这在层次聚类用于诸如搜索结果这样的顺序的或分级的数据时产生问题。例如,在许多现实世界场景中,数据项可以按一定顺序或等级呈现。例如,涉及以特定顺序或等级呈现的数据的现实世界场景可以包括检索到的搜索结果、待播放的媒体的推荐列表以及具有权重或概率的算法输出(例如,文本语料库中的主题关键字)。相反,在相关技术的层次聚类算法中,通常对所有数据项进行无序且相等的处理(例如,忽略分级或排序)。
尽管相关技术的层次聚类算法可以有助于用户查看数据集,但是当对数据进行分级并且数据大时,忽略分级信息可能导致探索低效。例如,由于分组标准,一个高权重的项可能位于树的非常深的层,使得浏览数据集的用户可能仅因为用户在该层之前停止扩展树而忽略这个重要的(例如,高级别)项,或者说因为它被有效地埋置聚类的树内而错过该项。一些相关技术系统可能试图通过在视觉界面中选择权重最高的项作为代表来解决这个问题,但是这种相关技术系统不能解决该问题,因为当高级别的项处于非常深的层中时,许多内部节点可以是相同或相似的。
发明内容
本申请的一些方面可以包括一种将与搜索查询关联的数据可视化的方法。该方法包括以下步骤:接收包括多个数据项的数据集,每个数据项具有关联的等级信息以及指示该数据项与一个或更多个其它数据项之间的相似度的相似度信息;基于所述等级信息来将所述数据集排序成分级列表;基于边界参数来屏蔽所述分级列表的连续部分;基于所述相似度信息来对所述分级列表中的除了被屏蔽的连续部分之外的部分进行迭代聚类,以产生聚类的分级数据列表;以及生成并显示代表所述聚类的分级数据列表的可视化,所述可视化包括代表所述聚类的分级数据列表中的每个集群的成形对象。
本申请的另外的方面可以包括一种非临时性计算机可读介质,该非临时性计算机可读介质被编码有用于使计算装置执行将与搜索查询关联的数据可视化的方法的指令。该方法包括以下步骤:接收包括多个数据项的数据集,每个数据项具有关联的等级信息以及指示该数据项与一个或更多个其它数据项之间的相似度的相似度信息;基于所述等级信息来将所述数据集排序成分级列表;基于边界参数来屏蔽所述分级列表的连续部分;基于所述相似度信息来对所述分级列表中的除了被屏蔽的连续部分之外的部分进行迭代聚类,以产生聚类的分级数据列表;以及生成并显示代表所述聚类的分级数据列表的可视化,所述可视化包括代表所述聚类的分级数据列表中的每个集群的成形对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010075015.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置