[发明专利]一种分析报告的生成方法、装置及电子设备在审

专利信息
申请号: 202010343686.X 申请日: 2020-04-27
公开(公告)号: CN113642303A 公开(公告)日: 2021-11-12
发明(设计)人: 李旭瑞;魏梦溪;李红松;孙常龙;张琼 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F40/186 分类号: G06F40/186;G06F40/205;G06F16/35;G06F16/245
代理公司: 北京领科知识产权代理事务所(特殊普通合伙) 11690 代理人: 张丹
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分析 报告 生成 方法 装置 电子设备
【说明书】:

发明提供了一种分析报告的生成方法、装置及电子设备,所述方法包括:接收用户的询问信息;解析所述询问信息中的用户意图;根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,得到与所述询问信息相对应的描述信息;根据所述描述信息生成所述询问信息的分析报告;其中,所述NLG存储信息通过如下方式产生:利用NLG算法将洞察产生的结构化信息生成对应的文字描述并进行存储。本发明能够利用历史数据高效地学习一套准确的NLG模板,并将其应用于自动报道生成领域。

技术领域

本发明涉及交互式数据分析技术领域,具体涉及一种分析报告的生成方法、装置及电子设备。

背景技术

利用程序自动写报道是很多公司在尝试的事。对于一部分结构化的信息,一方面需要进行一些图表的展示,另一方面,可以生成一些文字性的描述,从而帮助用户更好地理解内容。

底层所用到的文本生成技术一般有两种方案:基于模板和基于深度学习的方案。其中基于深度学习的模型主要依靠数据驱动,不需要太多人工干预,也很容易产生丰富又流畅的文字描述,但使用者往往无法直接操控内容生成,难以确保所输出的文本内容同输入数据中的信息吻合。而现阶段主流还是基于规则和模板的方法。这类方法具备明显的可解释性与可控制性,更容易确保所输出文本内容的正确性。当然基于模板的方法目前还有一定的局限性:优质模板的抽取还较为依赖人工特征工程或者规则干预。因此,如何高效地抽取模板是亟需要解决的问题。

发明内容

本发明的一个目的是提供一种分析报告的生成方法,配合NL2SQL技术以及洞察数据表交互式生成信息描述,利用槽位识别和领域规则学习细粒度的模板配置,并且利用历史数据自动学习全局粒度的模板方案,自动生成段落级别的专业信息描述。

为了达到上述目的,本发明的实施例提供了一种分析报告的生成方法,所述方法包括:

接收用户的询问信息;

解析所述询问信息中的用户意图;

根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,得到与所述询问信息相对应的描述信息;

根据所述描述信息生成所述询问信息的分析报告;

其中,所述NLG存储信息通过如下方式产生:利用NLG算法将洞察产生的结构化信息生成对应的文字描述并存储。

进一步地,所述解析所述询问信息中的用户意图,包括:将所述询问信息解析成多个结构化字段,所述多个结构化字段用于表示所述用户意图。

进一步地,所述方法还包括:根据所述多个结构化字段,利用所述NL2SQL技术生成对应的SQL语句;相应的,所述根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,包括:利用所述SQL语句查询在预设的NLG存储信息中进行查询。

进一步地,所述根据所述描述信息生成所述询问信息的分析报告包括:对所述描述信息进行槽位识别,得到不同槽位的信息;按照领域规则库中的规则,将所述不同槽位的信息进行组织,得到单句的描述信息;将多个单句的描述信息进行串联,生成所述询问信息的分析报告。

进一步地,所述将多个单句的描述信息进行串联,包括:识别一个单句中关注的槽位,根据所述关注的槽位将所述单句抽象成中间框架;对多个单句的中间框架进行聚类,得到每种中间框架的一个或多个特征;根据已构建的排序模型,为多个单句选择合适的中间框架作为模板;将单句中关注的槽位信息填入到模板中,并进行拼接。

进一步地,所述对多个单句的中间框架进行聚类包括:根据单句中的动词或者修饰词对所述中间框架进行聚类。

进一步地,所述方法还包括:为不同槽位的信息提供相应的同义词库,所述同义词库中的词用于:生成单句的描述信息时替换相应槽位的信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010343686.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top