[发明专利]用于汇总和引导多用户协作数据分析的系统和方法在审
申请号: | 202010235036.3 | 申请日: | 2020-03-30 |
公开(公告)号: | CN112148784A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 赵健 | 申请(专利权)人: | 富士施乐株式会社 |
主分类号: | G06F16/26 | 分类号: | G06F16/26;G06F9/451;G06F16/2457 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘久亮;黄纶伟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 汇总 引导 多用户 协作 数据 分析 系统 方法 | ||
用于汇总和引导多用户协作数据分析的系统和方法。本文描述的示例性实现涉及在地图上提供所生成图表的表示的图形用户界面(GUI)工具,其中,基于图表之间的相似度设置表示之间的距离。通过应用于图表的矢量化形式的机器学习技术确定相似度。本文描述的示例性实现使用深度学习技术将图表编码成矢量,这便于利用诸如最近邻之类的机器学习技术,基于其相应矢量确定图表之间的相似度。
技术领域
本公开涉及机器学习,并且更具体地,涉及通过图形用户界面(GUI)利用机器学习来生成适当的数据图表以及直接交互式数据探索的系统和方法。
背景技术
探索性可视化分析(EVA)是分析人员使用可视化方法(诸如绘制具有不同数据部分的图表)来标识感兴趣发现并做出数据驱动的决策的迭代过程。当分析人员不熟悉数据或具有模糊假设和定义不明确的任务时,难以开发全自动方法并且数据探索中强烈需要领域知识,EVA可以是有用的。该EVA方法被相关技术的许多商业工具广泛地推广和支持。
不幸地是,当数据集更大且更复杂(例如,涉及许多记录和属性)时,EVA过程变得充满挑战。由于存在用于编码属性、部分数据和图表以实现可视化分析的众多选择,因此探索空间变得过大。一种相关技术解决方案涉及让多个分析人员在协作设置下执行EVA。例如,每个分析人员可以独立地检查数据的不同视点,然后在某个时刻组合或移交其结果(例如,数据图表),并继续迭代地执行这样的过程。
发明内容
探索性视觉分析(EVA)可以通过将来自用户的领域知识集成到数据分析的处理中来利用。当数据集越大并且更复杂而需要多用户协作时,该处理可能会变得充满挑战。然而,有效地总结这些分析并进一步指示数据探索的推荐和方向仍然是相关技术实现中的问题。
当提供用于EVA实现的接口时,需要考虑几个问题。例如,需要提供接口,使得可以从多个分析人员创建的图表中学习信息,并有助于对潜在发现进行有效审查。对以前工作的良好了解对于基于知识的建立和分析人员之间的协同可以是非常重要的。在另一示例中,需要便于接口,使得能够利用所学的信息来确定数据探索的未来方向。视觉探索涉及利用图表的多种视觉编码选项在数据空间中搜索未知位置中的未知目标。因此,在这种手动处理中提供有用的指导对于分析人员用最少的努力达成目标来说可以是重要的GUI功能。
为了解决上述问题,本文描述的示例性实现利用元可视化方法,并且涉及GUI工具,该GUI工具提供对在多用户探索性视觉分析中生成的数据图表的视觉汇总,以及对有前途的未来数据探索的交互式引导。本文所述的GUI工具的示例性实现利用深度学习技术(例如,语法变分自编码器(GVAE))来学习图表的紧凑矢量表示,并利用语义和相似性将其可视化在二维画布(例如,二维地图)上。通过此汇总,分析人员能够识别可视化探索的当前空间内的图表的聚类、趋势和孔隙。此外,GUI工具的示例性实现允许通过基于所选局部区域提供图表推荐并通过使用用于图表生成的经过训练的自编码器来交互式地检查空间。因此,分析人员能够利用这些信息通过细化推荐的图表以引导他们的分析。
本公开的方面能够包括一种用于提供图形用户界面(GUI)以生成推荐图表的方法,该方法涉及以下步骤:在GUI上提供第一视图,第一视图被配置为在地图上提供多个图表的表示,多个图表的表示基于从多个图表到多个矢量的编码矢量化而推导出的相似度分布在第一视图的地图内;当在第一视图上选择了地图内的区域时,生成从所选区域与多个图表中的在所选区域内或附近的一个或更多个图表之间的相似度推导出的推荐图表,在GUI的第二视图上显示图表推荐;以及基于图表推荐与多个图表之间的相似度,在第一视图上的地图上的区域内提供图表推荐的另一表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010235036.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大数据分析的噪声自动消除
- 下一篇:切断装置及打印装置