[发明专利]文本信息生成方法、装置、终端设备在审
申请号: | 202110996630.9 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113656573A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 林玥煜;邓侃 | 申请(专利权)人: | 北京大数医达科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 信息 生成 方法 装置 终端设备 | ||
1.一种文本信息生成方法,包括:
获取目标文本和预先确定的预训练模型;
获取目标语料库,其中,所述目标语料库中的目标语料为目标文本和目标语句组成的数据对;
基于所述目标文本和所述目标语料库,生成目标输入特征;
将所述目标输入特征输入预先确定的预训练模型,生成结果文本;
接收用户输入的文本处理指令,其中,所述文本处理指令包括分类指令、生成指令;
将所述文本处理指令和所述结果文本推送至目标终端设备,其中,所述目标终端设备根据所述文本处理指令进行展示相关操作。
2.根据权利要求1所述的方法,其中,所述预先确定的预训练模型为语言模型。
3.根据权利要求2所述的方法,其中,所述基于所述目标文本和所述目标语料库,生成目标输入特征,包括:
在所述目标语料库中对所述目标文本进行比对查找;
响应于查找到所述目标文本,将对应于所述目标文本的目标语料确定为任务语料;
将所述目标文本和所述任务语料输入预先确定的生成模型,以得到所述目标输入特征。
4.根据权利要求3所述的方法,其中,所述预先训练的生成模型是通过如下步骤得到的:
利用所述目标语料库生成样本集,其中,所述样本集中的样本包括样本目标文本、样本任务语料和对应于所述样本目标文本、所述样本任务语料的样本输出特征;
确定初始生成模型的结构以及初始化所述初始生成模型的参数;
从所述样本集中选取样本,以及执行以下训练步骤:
将选取的样本的样本目标文本、样本任务语料输入至初始生成模型,得到所述选取的样本的输出特征;
将所述选取的样本的输出特征与对应的样本输出特征进行比较;
根据比较结果确定所述初始生成模型是否达到预设的优化目标;
响应于确定所述初始生成模型达到所述优化目标,将所述初始生成模型确定为预先训练的生成模型。
5.根据权利要求4所述的方法,其中,所述方法还包括:
响应于确定初始生成模型未训练完成,调整初始生成模型中的相关参数,以及从所述样本集中重新选取样本,使用调整后的初始生成模型作为初始生成模型,再次执行所述训练步骤。
6.根据权利要求5所述的方法,其中,所述利用所述目标语料库生成样本集,包括:
将所述目标语料库中的目标文本的集合确定为样本任务语料集合;
对于所述目标语料库中的每个目标语料,利用该目标语料的目标文本生成样本目标文本,以得到样本目标文本集合;
对于所述目标语料库中的每个目标语料,利用该目标语料的目标语句生成输出特征,以得到输出特征集合;
将所述输出特征集合确定为样本输出特征集合;
将所述样本目标文本集合、所述样本任务语料集合和所述输出特征集合的集合确定为所述样本集。
7.根据权利要求6所述的方法,其中,所述目标终端设备根据所述文本处理指令进行展示相关操作,包括:
响应于所述文本处理指令为分类指令,所述目标终端设备将所述结果文本输入预先确定的分类模型中,以得到分类结果;
所述目标终端设备展示所述分类结果。
8.根据权利要求7所述的方法,其中,所述目标终端设备根据所述处理指令进行展示相关操作,还包括:
响应于所述文本处理指令为生成指令,所述目标终端设备将所述结果文本输入预先确定的文本模型中,以得到终末文本;
所述目标终端设备展示所述终末文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大数医达科技有限公司,未经北京大数医达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110996630.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新会柑桂花红茶
- 下一篇:抗拔载体桩的施工方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置