[发明专利]基于对话改写模型的多轮文本到SQL方法及系统有效
申请号: | 202110308270.9 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112905637B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 俞凯;陈露;陈志 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F16/2452 | 分类号: | G06F16/2452;G06F16/242;G06N3/08 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对话 改写 模型 文本 sql 方法 系统 | ||
1.一种对话改写模型的训练方法,包括:
使用预训练的BART作为对话改写模型的改写器和简化器,其中,所述改写器和简化器都分别有各自对应的奖励函数,以用于评估话语质量;
基于无标注的多轮对话文本作为所述对话改写模型内改写器和简化器的联合训练的输入,生成了多种改写格式和简化格式;
利用语义数据集评估所述改写格式的话语质量,修正所述改写器对应的奖励函数,确定第一奖励函数,利用多轮文本到SQL数据集评估所述简化格式的话语质量,修正所述简化器对应的奖励函数,确定第二奖励函数;
基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器联合训练,得到训练后的对话改写模型。
2.根据权利要求1所述的方法,其中,所述无标注的多轮对话文本的文本量为第一数量;
所述语义数据集由第二数量有标注的多轮对话文本训练;
所述多轮文本到SQL数据集由第二数量有标注的多轮对话文本训练;
其中,所述第一数量小于第二数量。
3.根据权利要求1所述的方法,其中,所述联合训练包括共训练以及对偶训练;
所述基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器的对偶训练包括:
基于所述第一奖励函数对所述改写器进行策略梯度训练,以使所述改写格式对应的SQL查询意图趋近于预设真实查询意图;
基于所述第二奖励函数对所述简化器进行策略梯度训练,以使所述简化格式的语义趋近于预设原始文本语义。
4.根据权利要求3所述的方法,其中,所述基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器的共训练包括:
在所述基于所述第一奖励函数对所述改写器进行策略梯度训练之后,当所述改写格式的文本长度大于改写前的文本长度时,基于所述第一奖励函数对所述简化器进行最大似然估计训练;
在所述基于所述第二奖励函数对所述简化器进行策略梯度训练之后,当所述简化格式的文本长度小于简化前的文本长度时,基于所述第二奖励函数对所述改写器进行最大似然估计训练。
5.根据权利要求1所述的方法,其中,所述奖励函数包括:利用原始文本修正的令牌级奖励以及利用用户意图修正的句子级奖励。
6.一种基于对话改写模型的多轮文本到SQL方法,包括:
基于权利要求1所述的对话改写模型对多轮文本进行解耦,将所述多轮文本中的问题文本改写为包含语义的数据库查询问题文本;
利用单轮文本到SQL的模型解析所述包含语义的数据库查询问题文本,确定所述多轮文本对应的SQL语句。
7.根据权利要求6所述的方法,其中,所述单轮文本到SQL的模型包括:RATSQL。
8.一种对话改写模型的训练系统,包括:
模型确定程序模块,用于使用预训练的BART作为对话改写模型的改写器和简化器,其中,所述改写器和简化器都分别有各自对应的奖励函数,以用于评估话语质量;
输入程序模块,用于基于无标注的多轮对话文本作为所述对话改写模型内改写器和简化器的联合训练的输入,生成了多种改写格式和简化格式;
奖励函数确定程序模块,用于利用语义数据集评估所述改写格式的话语质量,修正所述改写器对应的奖励函数,确定第一奖励函数,利用多轮文本到SQL数据集评估所述简化格式的话语质量,修正所述简化器对应的奖励函数,确定第二奖励函数;
模型训练程序模块,用于基于所述第一奖励函数和所述第二奖励函数对所述改写器和简化器联合训练,得到训练后的对话改写模型。
9.根据权利要求8所述的系统,其中,所述联合训练包括共训练以及对偶训练;
所述模型训练程序模块用于:
基于所述第一奖励函数对所述改写器进行策略梯度训练,以使所述改写格式对应的SQL查询意图趋近于预设真实查询意图;
基于所述第二奖励函数对所述简化器进行策略梯度训练,以使所述简化格式的语义趋近于预设原始文本语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110308270.9/1.html,转载请声明来源钻瓜专利网。