[发明专利]一种获取目标意图识别模型的方法以及意图识别方法有效

专利信息
申请号: 202210571180.3 申请日: 2022-05-24
公开(公告)号: CN114757176B 公开(公告)日: 2023-05-02
发明(设计)人: 吴鹏劼;胡景超 申请(专利权)人: 上海弘玑信息技术有限公司
主分类号: G06F40/279 分类号: G06F40/279;G06F40/186;G06F40/30;G06F18/214
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 何明伦
地址: 201240 上海市闵*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 获取 目标 意图 识别 模型 方法 以及
【权利要求书】:

1.一种获取目标意图识别模型的方法,其特征在于,所述方法包括:

获取原始训练文本集,其中,所述原始训练文本集包括与至少两种意图类型中各意图类型分别对应的训练数据,所述训练数据包括多条原始训练语句以及与各条原始训练语句分别对应的原始标注标签,所述原始标注标签用于表征对应原始训练语句的真实意图;

根据所述原始训练文本集中的数据得到目标训练文本集,其中,所述目标训练文本集中的各条目标训练语句是通过对一个原始标注标签进行遮盖处理后得到的;

基于所述目标训练文本集中的数据对预训练掩码语言模型Bert进行微调,得到目标意图识别模型;

其中,

所述目标训练文本集包括第i目标训练语句以及与所述第i目标训练语句对应的目标标注标签;

所述第i目标训练语句包括:提示部分、遮盖文本以及第i原始训练语句,其中,所述遮盖文本用于遮挡第j原始标注标签,第j原始标注标签是与第i原始训练语句对应的;

所述目标标注标签包括:所述提示部分、所述第j原始标注标签以及所述第i原始训练语句。

2.如权利要求1所述的方法,其特征在于,所述根据所述原始训练文本集中的数据得到目标训练文本集,包括:

从所述原始训练文本集中提取与各种意图类型分别对应的所有的原始训练语句,并根据所述所有的原始训练语句得到所述目标训练文本集中的数据。

3.如权利要求1-2任一项所述的方法,其特征在于,

所述根据所述原始训练文本集中的数据得到目标训练文本集,包括:

从所述原始训练文本集中获取与所述第i目标训练语句的意图类型相同的第i原始训练语句,并获取与所述第i原始训练语句对应的第j原始标注标签;

获取提示模板,其中,所述提示模板包括提示部分以及待填入内容的空白部分,所述提示部分与在所述空白部分填入的内容构成语义完整的句子,所述语义完整是指所述句子包括主语、谓语和宾语;

根据所述提示模板和所述第i原始训练语句得到所述第i目标训练语句以及所述目标标注标签,其中,所述第i目标训练语句是将目标混入文本作为所述第i原始训练语句的前缀和后缀得到的,所述目标混入文本是通过遮盖待混入文本包括的所述第j原始标注标签得到的,所述待混入文本是通过将所述第j原始标注标签填充到所述空白部分得到的。

4.如权利要求3所述的方法,其特征在于,所述根据所述提示模板和所述第i原始训练语句得到所述第i目标训练语句,包括:

将所述第j原始标注标签填充到所述空白部分,得到所述待混入文本;

遮盖所述待混入文本包括的所述第j原始标注标签得到所述目标混入文本;

根据所述目标混入文本与所述第i原始训练语句得到所述第i目标训练语句。

5.如权利要求4所述的方法,其特征在于,所述根据所述目标混入文本与所述第i原始训练语句得到所述第i目标训练语句,包括:

将所述目标混入文本作为所述第i原始训练语句的前缀或者后缀,得到所述第i目标训练语句。

6.如权利要求3所述的方法,其特征在于,根据所述提示模板和所述第i原始训练语句得到所述目标标注标签,包括:

将所述第j原始标注标签填充到所述空白部分,得到所述待混入文本;

将所述待混入文本作为所述第i原始训练语句的前缀或者后缀,得到所述目标标注标签。

7.如权利要求5所述的方法,其特征在于,若所述目标混入文本作为所述第i原始训练语句的前缀,则所述第i目标训练语句为:所述提示部分+遮盖文本+所述第i原始训练语句,所述目标标注标签为:所述提示部分+所述第j原始标注标签+所述第i原始训练语句。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210571180.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top