[发明专利]用于执行自动数据分析的装置和方法、及计算机程序产品有效

专利信息
申请号: 201610874927.7 申请日: 2016-09-30
公开(公告)号: CN106557541B 公开(公告)日: 2020-06-12
发明(设计)人: 安东尼·埃梅卡·奥哈祖里克;安德烈亚·托马蒂斯;林岚 申请(专利权)人: 株式会社日立制作所
主分类号: G06F16/30 分类号: G06F16/30
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 龚伟;李鹤松
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出用于执行用于产品故障检测的分析输入数据(例如社交媒体数据和/或车载诊断数据)的自动分析的装置和方法。实行数据分析处理,其包括:单词计数处理,其确定单词计数数量,所述单词计数数量指示在所述社交媒体数据中的用户创建的文本文档中的数据库的关键词的出现频率;相关性确定处理,其对于多个关键词对中的每个,确定相关性系数;相关性链接识别处理,其识别确定的相关性系数是否超过相关性阈值的相关性链接的关键词对,以及相关性组识别处理,其基于所识别的相关性链接的关键词对来识别关键词的相关性组;以及如果识别关键词中的一个或多个相关性组,则输出指示关键词的一个或多个识别的相关性组中的至少一个的分析结果数据。
搜索关键词: 用于 执行 自动 数据 分析 装置 方法 计算机 程序 产品
【主权项】:
一种用于自动数据分析的方法,包括:‑提供(S1)指示多个关键词的一个或多个数据库;‑提供(S2)从一个或多个数据源获取的分析输入数据,以及预处理(S3)所述分析输入数据以生成可用于数据分析处理的预处理的分析输入数据,所述分析输入数据包括分别与多个数据样本中的至少一个相关联的多个文本文档;‑实行(S4)所述预处理的分析输入数据的数据分析处理,包括:‑单词计数处理(S42),其确定单词计数数量,对于所述多个数据样本的每个数据样本,所述单词计数数量指示所述预处理的分析输入数据的所述文本文档中的一个或多个数据库的关键词的出现频率,‑相关性确定处理(S44),其对于多个关键词对中的每个关键词对,确定与各自的关键词对相关联的各自的相关性系数,所述各自的相关性系数指示在对于所述多个数据样本的所述各自的关键词对的所述关键词的确定的单词计数数量之间的相关性的定量测量,‑相关性链接识别处理(S45),其识别相关性链接的关键词对,其中基于相关性标准,关键词对中的关键词被确定为彼此相关性链接,所述相关性标准包括与所述各自的关键词对相关联的确定的相关性系数是否超过相关性阈值的标准,以及‑相关性组识别处理(S48),其基于所识别的相关性链接的关键词对来识别关键词的相关性组,每个相关性组包括至少一个相关性链接的关键词对的关键词,并且对于在所述各自的相关性组中每个关键词,所述各自的相关性组进一步包括被识别为相关性链接到所述各自的关键词的其它关键词;以及‑如果识别关键词中的一个或多个相关性组,输出(S5)指示关键词的一个或多个识别的相关性组中的至少一个相关性组的分析结果数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610874927.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top