[发明专利]一种信息生成的方法、装置和存储介质在审
申请号: | 202011272860.2 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112348273A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 李浩然 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q30/06;G06K9/62 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 吴点;郑红娟 |
地址: | 100083 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 生成 方法 装置 存储 介质 | ||
本申请公开了一种信息生成的方法、装置和存储介质,具体为首先获取物品描述文本样本和摘要信息样本,并通输入预先训练的创意度预测模型,生成摘要信息样本的创意度分数,基于摘要信息样本和对应的创意度分数,训练得到物品摘要信息生成模型,并在训练时基于摘要信息样本对应的创意度分数中包含的创意度权重,计算物品摘要信息生成模型中的第一损失函数,优化物品摘要信息生成模型,获取待处理物品描述文本并输入物品摘要信息生成模型,生成与待处理物品描述文本对应的摘要信息。本申请实施例通过利用物品描述文本样本的创意度分数对训练样本进行加权,创意度分数越高的创意度权重越高,以使待训练的物品摘要信息生成模型输出创意度较高的摘要信息。
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息生成的方法、装置和存储介质。
背景技术
商品摘要作为可以简洁明确的突出商品性质和价值的内容,已被大规模的使用在电子商务领域。一般使用自然语言生成技术根据商品的详细文本介绍,自动生成商品摘,但生成的商品摘要不会对商品卖点进行限制,仅为通用文本,使得生成的商品摘要过于平淡,缺乏亮点,精确度不高。
发明内容
本申请实施例提供了一种信息生成的方法,克服了商品摘要生成时精确度不足的问题。
该方法包括:
获取物品描述文本样本和摘要信息样本;
将所述物品描述文本样本和所述摘要信息样本输入预先训练的创意度预测模型,生成所述摘要信息样本的创意度分数;
基于所述摘要信息样本和对应的所述创意度分数,训练得到物品摘要信息生成模型,并在训练时基于所述摘要信息样本对应的所述创意度分数中包含的创意度权重,计算所述物品摘要信息生成模型中的第一损失函数,并基于所述第一损失函数优化所述物品摘要信息生成模型;
获取待处理物品描述文本,并将所述待处理物品描述文本输入所述物品摘要信息生成模型,生成与所述待处理物品描述文本对应的摘要信息。
可选地,计算所述摘要信息样本中包含的至少一个样本词的创意度概率,所述创意度概率用于表示所述样本词或所述摘要信息样本所具备创意度的概率;
计算所述物品描述文本样本组成的训练集中包含的每个所述样本词的逆文本频率指数,以及,计算每个所述样本词的所述逆文本频率指数的均值,并将每个所述样本词的所述逆文本频率指数与均值的比值作为所述样本词的通用度分数,所述通用度分数用于表示所述样本词或所述摘要信息样本作为所述摘要信息样本的使用频率;
将所述摘要信息样本包含的每个所述样本词的所述创意度概率的均值作为所述摘要信息样本的所述创意度概率,以及,将所述摘要信息样本包含的每个所述样本词的所述通用度分数的均值作为所述摘要信息样本的所述通用度分数,并基于预设权重系数为所述创意度概率和所述通用度分数分配对应的创意度权重并求和,以生成所述摘要信息样本的所述创意度分数。
可选地,将所述摘要信息样本输入所述创意度预测模型中的创意度概率分类器,生成所述摘要信息样本中包含的至少一个所述样本词的创意度概率,其中,所述创意度概率分类器的训练过程为:
当所述样本词包含创意词信息时,通过待训练的所述创意度概率分类器生成所述样本词的预测创意度概率,通过所述预测创意度概率和预先确定的所述样本词的实际创意度概率计算交叉熵,确定所述预测创意度概率分类器的第二损失函数,进行迭代训练,确定所述预测创意度概率分类器。
可选地,基于所述摘要信息样本包含的至少一个样本词,生成所述样本词作为所述摘要信息样本的概率;
根据所述样本词可作为所述摘要信息样本的概率和所述样本词的所述创意度概率生成的损失函数,以及所述第二损失函数,生成所述待训练的物品摘要信息生成模型的所述第一损失函数,并基于所述第一损失函数对所述待训练的物品摘要信息生成模型进行训练,确定所述物品摘要信息生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011272860.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PE防渗透膜生产工艺
- 下一篇:一种海底用的线缆对接的初步处理装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置