[发明专利]文本数据分析方法、分析平台、终端及存储介质在审
申请号: | 201910184122.3 | 申请日: | 2019-03-13 |
公开(公告)号: | CN110083698A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 刘学文;孙文德;聂世刚;张伟;陈志才 | 申请(专利权)人: | 长沙湘计海盾科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F16/36 |
代理公司: | 广州凯东知识产权代理有限公司 44259 | 代理人: | 李勤辉 |
地址: | 410100 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标文本数据 文本数据分析 信息分析结果 分析平台 聚类统计 预设 计算机可读存储介质 终端 存储介质 获得信息 检索结果 检索条件 结果确定 文本数据 智能分析 推送 检索 | ||
本发明公开了一种文本数据分析方法,包括:在预设的检索范围内获取符合预设检索条件的目标文本数据;对各个所述目标文本数据进行聚类统计;根据所述聚类统计结果确定信息分析结果;将所述信息分析结果推送至用户。本发明还公开了一种分析平台、终端和计算机可读存储介质,本发明的技术方案旨在解决对检索结果中的众多文本数据进行智能分析从而获得信息分析结果的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文本数据分析方法、应用该文本数据分析方法的分析平台、终端和计算机可读存储介质。
背景技术
基于大数据平台的分析方法中,需要从海量中利用信息提取和文本挖掘的技术进行搜索,并将众多进行主题归类,以使用户能够快速地了解当前内容的聚焦点。
现有技术中,根据用户的检索条件在数据库中能检索获得众多文本数据,上述技术方案存在的弊端是,用户需要对检索结果进行分析和归纳才能获得数据信息分析结果,不能进行智能分析。
发明内容
本发明的主要目的在于提供一种文本数据分析方法,旨在对检索结果中的众多文本数据进行智能分析从而获得信息分析结果的问题。
为实现上述目的,本发明提供的文本数据分析方法包括如下步骤:
在预设的检索范围内获取符合预设检索条件的目标文本数据;
对各个所述目标文本数据进行聚类统计;
根据所述聚类统计结果确定信息分析结果;
将所述信息分析结果推送至用户。
优选地,所述对各个所述目标文本数据进行聚类统计的步骤,包括:
对各个所述目标文本数据进行文本语义分析,以获取各个所述目标文本数据的语义向量;
根据各个所述目标文本数据的语义向量计算各个所述目标文本数据之间的语义相似度;
根据所述语义相似度,对各个所述目标文本数据进行聚类统计。
优选地,所述根据所述聚类统计结果确定信息分析结果的步骤,包括:
确定聚类统计结果中每个类型的所述目标文本数据的主题,并确定聚类统计结果中每个类型的所述目标文本数据的数量;
根据每个类型的所述目标文本数据的主题和每个类型的所述目标文本数据的数量确定各个所述目标文本数据的主题排序结果;
根据所述主题排序结果确定信息分析结果。
优选地,还包括:
获取各个所述目标文本数据的发布时间;
所述根据所述主题排序结果确定信息分析结果的步骤,包括:
根据各个所述目标文本数据的发布时间和所述主题排序结果确定信息分析结果。
优选地,所述将所述信息分析结果推送至用户的步骤,包括:
根据每个类型的所述目标文本数据的数量排序,将每个类型的所述目标文本数据的主题推送至用户;
将所述目标文本的存储位置推送至用户。
优选地,所述在预设的检索范围内获取符合预设条件的目标文本数据的步骤之前,还包括:
获取用户预设的检索范围和预设的检索条件。
优选地,还包括:
根据所述检索范围和所述检索条件确定所述信息分析结果推送的目标用户。
此外,为实现上述目的,本发明还提供一种分析平台,所述分析平台应用如上述任一项所述的文本数据分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙湘计海盾科技有限公司,未经长沙湘计海盾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910184122.3/2.html,转载请声明来源钻瓜专利网。