[发明专利]基于BART模型的口语理解数据增强方法、系统及设备有效
申请号: | 202110540820.X | 申请日: | 2021-05-18 |
公开(公告)号: | CN113239151B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 周玉;林海涛;向露 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/211;G06F40/30;G06F18/214 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于自然语言处理技术领域,具体涉及了一种基于BART模型的口语理解数据增强方法、系统及设备,旨在解决的问题。本发明包括:将训练数据进行变换,去除其语义槽值信息或上下文表达方式的信息;利用预训练语言模型BART在变换的数据上进行调优,获得两种调优模型;分别使用两种调优模型和少量训练数据进行增强数据的生成;对增强数据进行过滤处理,获得最终的增强训练数据。本发明在只利用少量训练数据的前提下,可以生成具有不同语义槽值和上下文的带标签的增强训练数据,有效地提高了口语理解模型在少量数据下的语义槽填充的性能。 | ||
搜索关键词: | 基于 bart 模型 口语 理解 数据 增强 方法 系统 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110540820.X/,转载请声明来源钻瓜专利网。