[发明专利]样本生成方法以及装置在审
申请号: | 202310413988.3 | 申请日: | 2023-04-10 |
公开(公告)号: | CN116663547A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 何侵嵚;郎一宁;何源;薛晖 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/36;G06F16/35;G06F16/45 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 生成 方法 以及 装置 | ||
1.一种样本生成方法,包括:
获取目标任务关联的词单元序列;
将所述词单元序列输入文本生成模型,获得目标文本;
基于所述目标任务关联的知识图谱,判断所述目标文本是否满足所述目标任务的筛选条件;
在所述目标文本满足所述筛选条件的情况下,将所述目标文本输入媒体内容生成模型,获得目标媒体内容,并基于所述目标媒体内容获得所述目标任务的任务样本。
2.根据权利要求1所述的方法,所述基于所述目标媒体内容获得所述目标任务的任务样本之后,还包括:
将所述任务样本作为训练样本,根据所述筛选条件确定所述训练样本对应的训练样本标签;
利用所述训练样本以及所述训练样本标签,对所述目标任务的初始任务模型进行模型训练,获得满足预设训练停止条件的任务模型。
3.根据权利要求1所述的方法,所述基于所述目标媒体内容获得所述目标任务的任务样本之后,还包括:
将所述任务样本作为评估样本,根据所述筛选条件确定所述评估样本对应的评估样本标签;
将所述评估样本输入所述目标任务的待评估的任务模型,根据模型输出结果选择与所述评估样本标签不一致的评估样本作为目标评估样本;
基于所述目标评估样本确定任务调优样本,并利用所述任务调优样本优化评估后的任务模型,获得目标任务模型。
4.根据权利要求3所述的方法,所述基于所述目标评估样本确定任务调优样本,并利用所述任务调优样本优化评估后的任务模型,获得目标任务模型,包括:
创建所述目标评估样本对应的调优任务;
将所述调优任务作为目标任务,返回执行所述获取目标任务关联的词单元序列步骤,并将所述目标任务的任务样本作为任务调优样本;
利用所述任务调优样本,对评估后的任务模型进行模型调优,获得满足预设优化条件的目标任务模型。
5.根据权利要求1所述的方法,所述在所述目标文本满足所述筛选条件的情况下,将所述目标文本输入媒体内容生成模型,获得目标媒体内容,包括:
在所述目标文本满足所述筛选条件的情况下,在包含文本编码器以及图像生成器的媒体内容生成模型中,确定所述图像生成器中的预设目标参数;
按照预设生成规则生成所述预设目标参数对应的参数值,并根据所述参数值对所述图像生成器中的所述预设目标参数进行赋值,获得赋值后的图像生成器;
将所述目标文本输入所述媒体内容生成模型,通过所述媒体内容生成模型中所述文本编码器对所述目标文本进行编码处理,获得文本编码向量;
通过所述媒体内容生成模型中赋值后的图像生成器对所述文本编码向量进行图像生成处理,获得目标图像,并根据所述目标图像确定目标媒体内容。
6.根据权利要求5所述的方法,在所述媒体内容生成模型中包括视频生成器的情况下,所述按照预设生成规则,生成所述预设目标参数对应的参数值之后,还包括:
根据所述参数值对所述视频生成器中的所述预设目标参数进行赋值,获得赋值后的视频生成器;
所述根据所述目标图像确定目标媒体内容,包括:
通过所述媒体内容生成模型中赋值后的视频生成器对所述目标图像进行视频生成处理,获得目标视频;
根据所述目标视频确定目标媒体内容,或,根据所述目标图像以及所述目标视频确定目标媒体内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310413988.3/1.html,转载请声明来源钻瓜专利网。