[发明专利]文本挖掘支援方法及装置有效
申请号: | 201810156475.8 | 申请日: | 2018-02-24 |
公开(公告)号: | CN108628928B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 西川康平 | 申请(专利权)人: | 株式会社斯库林集团 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马爽;臧建明 |
地址: | 日本京都府京都市上京区堀*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 挖掘 支援 方法 装置 | ||
一种文本挖掘支援方法及装置,当显示表示对应分析的结果的散布图时,显示包含散布图与表示散布图的看法的启示的支援画面。当显示与单词及变数相关的散布图时,从不含启示的基本画面、含有原点附近的单词的判断方法作为启示的第1支援画面、含有对变数赋予特征的单词的关联度的判断方法作为启示的第2支援画面、含有单词彼此的类似度的判断方法作为启示的第3支援画面、及含有变数彼此的类似度的判断方法作为启示的第4支援画面中,显示利用者所指示的画面。由此,可有效率地进行从表示对应分析的结果的图表中引导出见解的处理。
技术领域
本发明涉及一种数据挖掘技术,尤其涉及一种支援文本挖掘(text mining)的执行的文本挖掘支援方法及装置。
背景技术
近年来,针对大量的数据应用统计学或模式识别等数据分析技术,并从大量的数据中引导出见解(数据中所显现的规则等)的数据挖掘技术正受到瞩目。将文本数据作为对象的数据挖掘被称为文本挖掘。以下,考虑针对文本数据,进行作为数据分析技术的一种的对应分析(correspondence analy sis)的情况。
在对应分析中,针对复合表(cross tabulation table),进行以表头项目与表侧项目之间的关联变成最大的方式重新排列各项目的处理。进行对应分析的结果通常使用散布图(二维图表)来表现。例如,若对图2中所示的复合表进行对应分析,则可获得图3中所示的散布图。
在与本申请发明相关联的日本专利特开2005-44087号公报中,记载有一种对利用者提示使用多个分析工具时的分析流程的文本挖掘系统。若使用所述文献中所记载的系统,则即便是与文本挖掘相关的知识或经验少的利用者,也能够以适宜的顺序使用多个分析工具进行分析。
发明内容
[发明所要解决的问题]
在对应分析中,与求出散布图相比,对所求出的散布图进行考察,并引导出见解更重要。但是,与文本挖掘相关的知识或经验少的利用者不懂散布图的看法,因此即便观看散布图,也不懂首先进行什么才好。因此,知识或经验少的利用者无法有效率地进行从散布图中引导出见解的处理。
专利文献1中所记载的系统虽然对利用者提示分析流程,但并不支援从分析结果中引导出见解的处理。因此,即便使用专利文献1中所记载的系统,也无法解决所述课题。
因此,本发明的目的在于提供一种用以有效率地进行从表示对应分析的结果的图表中引导出见解的处理的文本挖掘支援方法及装置。
[解决问题的技术手段]
为了达成所述目的,本发明具有以下的特征。
本发明的第1实施例是一种文本挖掘支援方法,其显示由对应分析所得的分析结果,其包括
输入所述分析结果的步骤;
输入来自利用者的指示的步骤;
生成包含表示所述分析结果的图表的画面的画面数据的步骤;以及
根据所述画面数据,显示画面的步骤;且
所述生成画面数据的步骤对应于所述指示,生成包含所述图表与表示所述图表的看法的启示(hint)的支援画面的画面数据。
本发明的第2实施例是在本发明的第1实施例中,
所述生成画面数据的步骤生成从多个支援画面与包含所述图表且不含所述启示的基本画面之中,对应于所述指示所选择的画面的画面数据。
本发明的第3实施例是在本发明的第2实施例中,
在所述输入分析结果的步骤中,输入将第1项目与第2项目建立对应的结果,即包含所述第1项目的第1成分及第2成分与所述第2项目的第1成分及第2成分的结果作为所述分析结果,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社斯库林集团,未经株式会社斯库林集团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810156475.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:社交系统、方法及电子装置
- 下一篇:用于智能存档和分析的方法和装置