[发明专利]一种分析报告的生成方法、装置及电子设备在审
申请号: | 202010343686.X | 申请日: | 2020-04-27 |
公开(公告)号: | CN113642303A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 李旭瑞;魏梦溪;李红松;孙常龙;张琼 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/205;G06F16/35;G06F16/245 |
代理公司: | 北京领科知识产权代理事务所(特殊普通合伙) 11690 | 代理人: | 张丹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分析 报告 生成 方法 装置 电子设备 | ||
本发明提供了一种分析报告的生成方法、装置及电子设备,所述方法包括:接收用户的询问信息;解析所述询问信息中的用户意图;根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,得到与所述询问信息相对应的描述信息;根据所述描述信息生成所述询问信息的分析报告;其中,所述NLG存储信息通过如下方式产生:利用NLG算法将洞察产生的结构化信息生成对应的文字描述并进行存储。本发明能够利用历史数据高效地学习一套准确的NLG模板,并将其应用于自动报道生成领域。
技术领域
本发明涉及交互式数据分析技术领域,具体涉及一种分析报告的生成方法、装置及电子设备。
背景技术
利用程序自动写报道是很多公司在尝试的事。对于一部分结构化的信息,一方面需要进行一些图表的展示,另一方面,可以生成一些文字性的描述,从而帮助用户更好地理解内容。
底层所用到的文本生成技术一般有两种方案:基于模板和基于深度学习的方案。其中基于深度学习的模型主要依靠数据驱动,不需要太多人工干预,也很容易产生丰富又流畅的文字描述,但使用者往往无法直接操控内容生成,难以确保所输出的文本内容同输入数据中的信息吻合。而现阶段主流还是基于规则和模板的方法。这类方法具备明显的可解释性与可控制性,更容易确保所输出文本内容的正确性。当然基于模板的方法目前还有一定的局限性:优质模板的抽取还较为依赖人工特征工程或者规则干预。因此,如何高效地抽取模板是亟需要解决的问题。
发明内容
本发明的一个目的是提供一种分析报告的生成方法,配合NL2SQL技术以及洞察数据表交互式生成信息描述,利用槽位识别和领域规则学习细粒度的模板配置,并且利用历史数据自动学习全局粒度的模板方案,自动生成段落级别的专业信息描述。
为了达到上述目的,本发明的实施例提供了一种分析报告的生成方法,所述方法包括:
接收用户的询问信息;
解析所述询问信息中的用户意图;
根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,得到与所述询问信息相对应的描述信息;
根据所述描述信息生成所述询问信息的分析报告;
其中,所述NLG存储信息通过如下方式产生:利用NLG算法将洞察产生的结构化信息生成对应的文字描述并存储。
进一步地,所述解析所述询问信息中的用户意图,包括:将所述询问信息解析成多个结构化字段,所述多个结构化字段用于表示所述用户意图。
进一步地,所述方法还包括:根据所述多个结构化字段,利用所述NL2SQL技术生成对应的SQL语句;相应的,所述根据所述用户意图在预设的自然语言产生NLG存储信息中进行查询,包括:利用所述SQL语句查询在预设的NLG存储信息中进行查询。
进一步地,所述根据所述描述信息生成所述询问信息的分析报告包括:对所述描述信息进行槽位识别,得到不同槽位的信息;按照领域规则库中的规则,将所述不同槽位的信息进行组织,得到单句的描述信息;将多个单句的描述信息进行串联,生成所述询问信息的分析报告。
进一步地,所述将多个单句的描述信息进行串联,包括:识别一个单句中关注的槽位,根据所述关注的槽位将所述单句抽象成中间框架;对多个单句的中间框架进行聚类,得到每种中间框架的一个或多个特征;根据已构建的排序模型,为多个单句选择合适的中间框架作为模板;将单句中关注的槽位信息填入到模板中,并进行拼接。
进一步地,所述对多个单句的中间框架进行聚类包括:根据单句中的动词或者修饰词对所述中间框架进行聚类。
进一步地,所述方法还包括:为不同槽位的信息提供相应的同义词库,所述同义词库中的词用于:生成单句的描述信息时替换相应槽位的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010343686.X/2.html,转载请声明来源钻瓜专利网。