[发明专利]报表生成方法、装置、计算机设备和存储介质在审
申请号: | 201811210013.6 | 申请日: | 2018-10-17 |
公开(公告)号: | CN109542956A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 邱寒;杨镭;黄北辰;朱昱锦;付晓 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/2455;G06F16/951;G06F16/338 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 报表生成 词条 计算机设备 报表数据 存储介质 检索事件 检索意图 统计数据 维度 筛选 数据源库 意图识别 语义识别 匹配 监测 申请 统计 | ||
本申请涉及一种报表生成方法、装置、计算机设备和存储介质。基于语义识别的报表生成方法包括:监测报表检索事件;获取与报表检索事件对应的检索词条;通过已训练的意图识别模型对检索词条进行识别,得到与检索词条对应的检索范围、检索维度以及检索意图;按照检索范围、检索维度从数据源库中筛选出报表数据;对筛选出的报表数据按照检索意图进行统计汇总,得到统计数据;根据统计数据生成报表。采用本方法不用约束用户的输入即可生成匹配较高的报表。
技术领域
本申请涉及计算机技术领域,特别是涉及一种报表生成方法、装置、计算机设备和计算机可读存储介质。
背景技术
目前,市场上针对各行各业都配备有相应的大数据平台,这些平台可以根据用户的输入检索大量的数据并进行统计,还可以报表的形式将统计的结果可视化地呈现给用户,满足用户的数据分析需求。
然而,很多大数据平台为了能够得到与用户的输入匹配的分析结果,在平台中约束了用户的输入的格式,用户只能在平台中以固定的预设格式输入,不够灵活,又或者,在平台不约束用户的输入的格式时,得到的统计结果与用户随意的输入之间的匹配度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种不用约束用户的输入即可生成匹配较高的报表的报表生成方法、装置、计算机设备和存储介质。
一种报表生成方法,所述方法包括:
监测报表检索事件;
获取与所述报表检索事件对应的检索词条;
通过已训练的意图识别模型对所述检索词条进行识别,得到与所述检索词条对应的检索范围、检索维度以及检索意图;
按照所述检索范围、检索维度从数据源库中筛选出报表数据;
对筛选出的报表数据按照所述检索意图进行统计汇总,得到统计数据;
根据所述统计数据生成报表。
在其中一个实施例中,还包括:
获取用户选定的业务场景类别;
所述按照所述检索范围、检索维度从数据源库中筛选出报表数据包括:
按照所述检索范围、检索维度,从与所述业务场景类别对应的数据源库中筛选出报表数据。
在其中一个实施例中,所述通过已训练的意图识别模型对所述检索词条进行识别,得到与所述检索词条对应的检索范围、检索维度以及检索意图包括:
对所述检索词条进行向量化处理,得到检索词条向量;
将所述检索词条向量输入至已训练的意图识别模型中,通过所述意图识别模型的隐藏层对所述检索词条向量进行处理,得到所述检索词条对应的检索词条编码向量;
通过所述意图识别模型的输出层对所述检索词条编码向量进行变换,得到与所述检索词条对应的检索范围、检索维度以及检索意图。
在其中一个实施例中,还包括:
获取从网络上爬取的文档集;
确定所述检索词条与所述文档集中每个文档之间的相关度;
从所述文档集中选取相关度符合预设条件的文档;
将选取的所述文档的文档标识展示在生成的报表中。
在其中一个实施例中,所述确定所述检索词条与所述文档集中每个文档之间的相关度包括:
统计所述文档集中每个文档所包含词语的词频;
按照所述词频确定每个文档对应的关键词集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811210013.6/2.html,转载请声明来源钻瓜专利网。