[发明专利]一种基于自然语言处理及图像算法的文章自动生成系统和方法在审
申请号: | 202010176734.0 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111428472A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 孟宪坤;边树森;刘志军 | 申请(专利权)人: | 浙江华坤道威数据科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/258;G06F40/189;G06K9/00;G06F16/335;G06F16/58;G06N3/04;G06N3/08 |
代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 陈继算 |
地址: | 310016 浙江省杭州市余杭区余杭街道*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 图像 算法 文章 自动 生成 系统 方法 | ||
1.一种基于自然语言处理及图像算法的文章自动生成系统,其特征在于,包括:
操作终端,输入产品信息query和用户信息、输出最终推文;
基础标签提取系统,根据输入的产品信息和用户信息,利用BERT预训练模型提取关键字,建立多个标签;
内容生成模块,包括标题生成模型、短文生成模型和图像生成模型,根据标签信息生成相应的若干标题、若干文章内容d和若干与文章内容相符的图片;智能筛选模块,包括文章筛选模块和图片筛选模块,对于多个文章内容与相符图片的组合,利用文章筛选模块和图片筛选模块进行筛选,得到符合要求的一组文章内容与相符图片;
智能排版模块,对最终选择的文章及相符图片进行排版,得到最终推文。
2.根据权利要求1所述的一种基于自然语言处理及图像算法的文章自动生成系统,其特征在于:所述智能排版模块包括文本数据库,通过深度学习BERT算法训练出自动对文章与图片进行排版的模型。
3.根据权利要求1所述的一种基于自然语言处理及图像算法的文章自动生成系统,其特征在于:所述内容生成模块包括收集的标题数据库、不同类型的短文数据库;通过BERT预训练模型训练分别得到标题生成模型和短文生成模型;通过图像生成模型-StackGAN算法绘制出与短文相符的图片。
4.根据权利要求3所述的一种基于自然语言处理及图像算法的文章自动生成系统,其特征在于:所述图片筛选模块,根据图像生成模型-StackGAN算法计算相符图片与文章内容的契合度,设定阈值,选择契合度最高的相符图片。
5.根据权利要求3所述的一种基于自然语言处理及图像算法的文章自动生成系统,其特征在于:所述文章筛选模块,通过BERT预训练模型计算产品信息query和每篇文档d之间的相关性分数,query中包括词q1,q2...qn,相关性分数的计算公式为:
其中R(qi,d)是查询语句query中每个词qi和文档d的相关度值,Wi是词qi的逆向文档频率IDF,其中,N为文档总数,n(qi)为包含词qi的文档数;
其中,k1,k2,b为调节因子,qfi为词qi在查询语句query中的出现频率,fi为qi在文档d中的出现频率,dl为文档d的长度,avgdl为所有文档的平均长度;
计算每个文档d与query的相关性分数,设定阈值,将阈值与每个计算完成的相关性分数进行比较,选择相关度适合的相符文章。
6.根据权利要求1-5所述的一种基于自然语言处理及图像算法的文章自动生成方法,其特征在于,包括以下步骤:
S1,通过操作终端输入产品信息和用户信息;
S2,所述基础标签提取系统对输入的内容提取关键字,建立多个标签;
S3,所述内容生成模块根据S2步骤生成的标签信息,生成符合标签的多个标题、多个文章内容以及多个与文章内容相符的图片;
S4,通过智能筛选模块筛选出一个短文和契合度最高的相符图片;经筛选后无法获得操作人认可,则从步骤S2重新开始,直到筛选出满意的一个短文和契合度最高的相符图片;
S5,通过智能排版模块对短文和相符图片进行排版,得到最终的推文,将推文通过操作终端输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华坤道威数据科技有限公司,未经浙江华坤道威数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010176734.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序