[发明专利]文本挖掘方法、文本挖掘程序以及文本挖掘装置有效
申请号: | 201910096738.5 | 申请日: | 2019-01-31 |
公开(公告)号: | CN110309290B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 柿木未希 | 申请(专利权)人: | 株式会社斯库林集团 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/338 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 向勇;宋晓宝 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 挖掘 方法 程序 以及 装置 | ||
1.一种文本挖掘方法,用于显示包含文本数据的分析结果的画面,其特征在于,包括:
从文本数据中提取字词的步骤;
针对所述字词生成共现矩阵的步骤;
基于所述共现矩阵生成共现网络的步骤;以及
显示包含所述共现网络的画面的步骤,
当在包含以指定的整体文本数据为基础的第一共现网络的第一画面中输入了指定关注语的指示时,提取所述字词的步骤为从限定文本数据中提取所述字词,该限定文本数据由所述指定的文本数据中的包含所述关注语的部分构成,生成所述共现矩阵的步骤为针对所述字词使用所述限定文本数据生成第二共现矩阵,生成所述共现网络的步骤为基于所述第二共现矩阵生成第二共现网络,显示所述画面的步骤为显示包含所述第二共现网络的第二画面。
2.根据权利要求1所述的文本挖掘方法,其特征在于,
通过在所述第一画面中选择所述第一共现网络中包含的一个或多个节点并选择开始分析,从而输入将与所述节点对应的字词指定为所述关注语的指示。
3.根据权利要求1所述的文本挖掘方法,其特征在于,
通过在所述第一画面中连续选择所述第一共现网络中包含的一个节点,从而输入将与所述节点对应的字词指定为所述关注语的指示。
4.根据权利要求1所述的文本挖掘方法,其特征在于,
通过在所述第一画面中连续选择所述第一共现网络中包含的一个边,从而输入将与所述边连接的两个节点所对应的字词指定为所述关注语的指示。
5.根据权利要求1所述的文本挖掘方法,其特征在于,
通过在所述第一画面中选择所述第一共现网络中包含的一个或多个边并选择开始分析,从而输入将与所述边连接的多个节点所对应的字词指定为所述关注语的指示。
6.根据权利要求1所述的文本挖掘方法,其特征在于,
当在包含多个第二共现网络的第二画面中输入了合并指示时,显示所述画面的步骤以选项卡方式来显示所述多个第二共现网络。
7.根据权利要求6所述的文本挖掘方法,其特征在于,
通过在所述第二画面中抓取一个第二共现网络并释放到另一个第二共现网络中,从而输入所述合并指示。
8.根据权利要求1所述的文本挖掘方法,其特征在于,
所述限定文本数据由所述指定的文本数据中的、包含所述关注语的句子构成。
9.根据权利要求8所述的文本挖掘方法,其特征在于,
指定了多个关注语的所述限定文本数据由所述指定的文本数据中的、包含所有所述多个关注语的句子构成。
10.根据权利要求8所述的文本挖掘方法,其特征在于,
指定了多个关注语的所述限定文本数据由所述指定的文本数据中的、包含所述多个关注语中的任意一个关注语的句子构成。
11.根据权利要求1所述的文本挖掘方法,其特征在于,
生成所述共现矩阵的步骤中,生成将Jaccard系数作为元素的共现矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社斯库林集团,未经株式会社斯库林集团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910096738.5/1.html,转载请声明来源钻瓜专利网。