[发明专利]一种基于自然语言处理及图像算法的文章自动生成系统和方法在审
申请号: | 202010176734.0 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111428472A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 孟宪坤;边树森;刘志军 | 申请(专利权)人: | 浙江华坤道威数据科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/258;G06F40/189;G06K9/00;G06F16/335;G06F16/58;G06N3/04;G06N3/08 |
代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 陈继算 |
地址: | 310016 浙江省杭州市余杭区余杭街道*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 图像 算法 文章 自动 生成 系统 方法 | ||
本发明公开了一种基于自然语言处理及图像算法的文章自动生成系统和方法,涉及人工智能领域,包括操作终端,输入产品信息和用户信息、输出最终推文;基础标签提取系统,根据输入的产品信息和用户信息,利用BERT预训练模型提取关键字,建立多个标签;内容生成模块,根据标签信息生成相应的若干标题、若干文章内容和若干与文章内容相符的图片;智能筛选模块,包括文章筛选模块和图片筛选模块,对于多个文章内容与相符图片的组合,利用文章筛选模块和图片筛选模块进行筛选,得到符合要求的一组文章内容与相符图片;智能排版模块,对最终选择的文章及相符图片进行排版,得到最终推文。
技术领域
本发明涉及人工智能领域,具体为一种基于自然语言处理及图像算法的文章自动生成系统和方法。
背景技术
目前,企业向用户推荐产品的方式越来越多,为了让打出去的广告能够更吸引用户的关注,最常见的方式就是各大平台的文章推荐。传统通常采用人工方式撰写短文,有以下缺点:一、需要编写的短文数量巨大,且编写过程较为繁琐,导致需要花费大量时间才能完成,使短文生成率低下;二、短文的撰写往往基于企业角度,对用户是吸引力小,导致推荐的短文适用性太差;三、为了吸引更多的关注,让文章中包含贴合主旨的图画也是必不可少的,当前技术中缺乏对图像生成的研究。
发明内容
本发明的目的在于提供一种基于自然语言处理及图像算法的文章自动生成系统和方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于自然语言处理及图像算法的文章自动生成系统,包括:
操作终端,输入产品信息query和用户信息、输出最终推文;
基础标签提取系统,根据输入的产品信息和用户信息,利用BERT预训练模型提取关键字,建立多个标签;
内容生成模块,包括标题生成模型、短文生成模型和图像生成模型,根据标签信息生成相应的若干标题、若干文章内容Ds和若干与文章内容相符的图片;
智能筛选模块,包括文章筛选模块和图片筛选模块,对于多个文章内容与相符图片的组合,利用文章筛选模块和图片筛选模块进行筛选,得到符合要求的一组文章内容与相符图片;
智能排版模块,对最终选择的文章及相符图片进行排版,得到最终推文。
通过输入简单的产品信息,即可产生推文和相应的图片,节约了大量的人力时间,提高了工作效率。
作为本发明的一种优选技术方案,所述智能排版模块包括文本数据库,通过深度学习BERT算法训练出自动对文章与图片进行排版的模型。
作为本发明的一种优选技术方案,所述内容生成模块包括收集的标题数据库、不同类型的短文数据库;通过BERT预训练模型训练分别得到标题生成模型和短文生成模型;通过图像生成模型-StackGAN算法绘制出与短文相符的图片。
作为本发明的一种优选技术方案,所述图片筛选模块,根据图像生成模型-StackGAN算法计算相符图片与文章内容的契合度,设定阈值,选择契合度最高的相符图片。
作为本发明的一种优选技术方案,所述文章筛选模块,所述文章筛选模块,通过BERT预训练模型计算产品信息query和每篇文档d之间的相关性分数,query中包括词q1,q2...qn,相关性分数的计算公式为:
其中R(qi,d)是查询语句query中每个词qi和文档d的相关度值,Wi是词qi的逆向文档频率IDF,其中,N为文档总数,n(qi)为包含词qi的文档数;
其中,k1,k2,b为调节因子,qfi为词qi在查询语句query中的出现频率,fi为qi在文档d中的出现频率,dl为文档d的长度,avgdl为所有文档的平均长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华坤道威数据科技有限公司,未经浙江华坤道威数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010176734.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序