[发明专利]基于政务领域知识图谱的多轮对话方法及系统在审
申请号: | 201910808641.2 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112445946A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 左骏;王驹冬;黄建强;丁庆 | 申请(专利权)人: | 上海卓繁信息技术股份有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/953 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 政务 领域 知识 图谱 轮对 方法 系统 | ||
本发明公开了一种基于政务领域知识图谱的多轮对话方法,包括:搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为网络的输入,将人机对话语料中机器作答作为网络的输出。
技术领域
本发明涉及自然语言处理中的人机对话技术领域,特别是涉及一种基于政务领域知识图谱的多轮对话方法及系统。
背景技术
现有技术中,用户在网页端进行行业政务查询时,出现查询困难、搜索结果不好的缺点。
发明内容
本发明针对现有技术存在的问题和不足,提供一种基于政务领域知识图谱的多轮对话方法及系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种基于政务领域知识图谱的多轮对话方法,其特点在于,其包括以下步骤:
S1、搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
S2、对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
S3、利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
S4、构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
较佳地,在步骤S2中,三元组数据为jena系统中TDB格式序列化三元组数据。
本发明还提供一种基于政务领域知识图谱的多轮对话系统,其特点在于,其包括搜集模块、处理模块、扩充模块和构建模块;
所述搜集模块用于搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
所述处理模块用于对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
所述扩充模块用于利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
所述构建模块用于构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
较佳地,三元组数据为jena系统中TDB格式序列化三元组数据。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明利用知识图谱推理和多轮对话系统人性化的特点,设计出一种领域知识图谱的多轮对话系统。通过构建政务领域知识图谱,设计基于transformer的对话系统作为交互系统,实现基于政务领域知识图谱的多轮对话系统。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卓繁信息技术股份有限公司,未经上海卓繁信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808641.2/2.html,转载请声明来源钻瓜专利网。