[发明专利]一种大批量文本数据自动分析方案在审
申请号: | 201810234028.X | 申请日: | 2018-03-21 |
公开(公告)号: | CN108536762A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 王悦;陈石 | 申请(专利权)人: | 上海蔚界信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201913 上海市崇明区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本数据 文本类数据 自动分析 分析 数据基本信息 自动化分析 短语 结果解析 模型算法 全面分析 主题分析 可视化 情感词 权重 算法 词句 推断 词语 统计 直观 分类 帮助 | ||
本发明公开了一种大批量文本数据自动分析方案,它涉及文本类数据分析领域。此方案从五大角度对文本类数据进行分析,分别是1.数据基本信息与词句统计;2.词语和短语的权重统计;3.情感词推断;4.分类分析;5.主题分析;系统通过模型算法进行这五类分析之后,将结果解析并生成特定的可视化图表展现出来,进而用户可以直观获取到文本数据全面分析结论。本发明通过一系列功能、算法和图表的设计,实现一种对大批量文本数据的自动化分析,帮助分析人员快速获得关于文本数据的总结性结论。
技术领域
本发明涉及的是文本类数据分析领域,具体涉及一种对大批量文本数据进行多个不同角度的计算分析并形成总结性结果的算法流程方案,主要应用在舆情分析、社交网络分析、客服对话分析等场景。
背景技术
日常和商业行为中会产生大量的文本类数据,相关技术的发展也使得文本数据分析越来越重要。目前对于文本类数据的自动分析方法,主要是先通过人工建模、编程,进行单一角度的分析,再由专业人员理解和解释计算机后台表格的结果。
采用这类方案需要较为专业的技术人员,其优点是可以对特定数据、特定角度进行定制化的深入分析。但对于一般分析人员,这类方法较难掌握,高成本低效率,且其结果无法对大批量文本数据有一个全面、直观的解释。目前,尚没有一种综合技术方案,可以自动化地、高效率地实现对大批量文本数据的分析,并形成图表化的、易理解的分析结果。
综上所述,本发明设计了一种大批量文本数据自动分析方案。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种大批量文本数据自动分析方案,通过一系列功能、算法和图表的设计,实现一种对大批量文本数据的自动化分析,帮助分析人员快速获得关于文本数据的总结性结论。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种大批量文本数据自动分析方案,此方案从五大角度对文本类数据进行分析,分别是1.数据基本信息与词句统计;2. 词语和短语的权重统计;3.情感词推断;4.分类分析;5.主题分析;系统通过模型算法进行这五类分析之后,将结果解析并生成特定的可视化图表展现出来,进而用户可以直观获取到文本数据全面分析结论。
本发明定义文本类数据中,每一条记录为一个文档,每个文档由一名用户产生,例如一条评论、一条微博、一篇文章,每一个文档都有一个文档编号进行独立区分。对于本发明,文档数据条数在十万量级左右,所带来的有益效果最高。
基于上述五个角度的分析,用户可以快速、自动化地获得对于待分析文档的全面、直观认识,从而更快、更准确的切入到对于大量文本内容的分析中去。
本发明与现有技术相比有如下优势和有益效果:
1.本发明设计的分析流程方法实现后是全自动的,省去了复杂人工开发调整,不仅节省了很大工作量,还使得文本分析更容易得到使用,不再需要由专业技术人员开发;
2.本发明抓住了不同场景、不同类型下的文本分析的共同需求,从文本分析的五个最重要的角度出发,对文档进行了全方位分析,使得用户对文档有更全面的认识,提升实际应用分析的效果;
3.本发明中核心算法的结果,被转化为可视化图表的形式展现,不再需要专业人员解读,使得一般用户可理解,并且更加直观可靠。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明的自动分析方案框图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蔚界信息科技有限公司,未经上海蔚界信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810234028.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:报表数据查询方法及服务器
- 下一篇:一种下拉提示方法和装置