[发明专利]用于执行自动数据分析的装置和方法、及计算机程序产品有效
申请号: | 201610874927.7 | 申请日: | 2016-09-30 |
公开(公告)号: | CN106557541B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 安东尼·埃梅卡·奥哈祖里克;安德烈亚·托马蒂斯;林岚 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F16/30 | 分类号: | G06F16/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 龚伟;李鹤松 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出用于执行用于产品故障检测的分析输入数据(例如社交媒体数据和/或车载诊断数据)的自动分析的装置和方法。实行数据分析处理,其包括:单词计数处理,其确定单词计数数量,所述单词计数数量指示在所述社交媒体数据中的用户创建的文本文档中的数据库的关键词的出现频率;相关性确定处理,其对于多个关键词对中的每个,确定相关性系数;相关性链接识别处理,其识别确定的相关性系数是否超过相关性阈值的相关性链接的关键词对,以及相关性组识别处理,其基于所识别的相关性链接的关键词对来识别关键词的相关性组;以及如果识别关键词中的一个或多个相关性组,则输出指示关键词的一个或多个识别的相关性组中的至少一个的分析结果数据。 | ||
搜索关键词: | 用于 执行 自动 数据 分析 装置 方法 计算机 程序 产品 | ||
【主权项】:
一种用于自动数据分析的方法,包括:‑提供(S1)指示多个关键词的一个或多个数据库;‑提供(S2)从一个或多个数据源获取的分析输入数据,以及预处理(S3)所述分析输入数据以生成可用于数据分析处理的预处理的分析输入数据,所述分析输入数据包括分别与多个数据样本中的至少一个相关联的多个文本文档;‑实行(S4)所述预处理的分析输入数据的数据分析处理,包括:‑单词计数处理(S42),其确定单词计数数量,对于所述多个数据样本的每个数据样本,所述单词计数数量指示所述预处理的分析输入数据的所述文本文档中的一个或多个数据库的关键词的出现频率,‑相关性确定处理(S44),其对于多个关键词对中的每个关键词对,确定与各自的关键词对相关联的各自的相关性系数,所述各自的相关性系数指示在对于所述多个数据样本的所述各自的关键词对的所述关键词的确定的单词计数数量之间的相关性的定量测量,‑相关性链接识别处理(S45),其识别相关性链接的关键词对,其中基于相关性标准,关键词对中的关键词被确定为彼此相关性链接,所述相关性标准包括与所述各自的关键词对相关联的确定的相关性系数是否超过相关性阈值的标准,以及‑相关性组识别处理(S48),其基于所识别的相关性链接的关键词对来识别关键词的相关性组,每个相关性组包括至少一个相关性链接的关键词对的关键词,并且对于在所述各自的相关性组中每个关键词,所述各自的相关性组进一步包括被识别为相关性链接到所述各自的关键词的其它关键词;以及‑如果识别关键词中的一个或多个相关性组,输出(S5)指示关键词的一个或多个识别的相关性组中的至少一个相关性组的分析结果数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610874927.7/,转载请声明来源钻瓜专利网。
- 上一篇:用于晶圆与机台指派的系统
- 下一篇:一种晶体管仿真系统及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置