[发明专利]基于新闻内容语义分析的多媒体智能配图方法有效
申请号: | 202110496811.5 | 申请日: | 2021-05-07 |
公开(公告)号: | CN113220834B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 朱迦榕;马利庄;杨太海 | 申请(专利权)人: | 上海财联社金融科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/55;G06V10/28;G06V10/34;G06V10/764 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 董自亮 |
地址: | 200000 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 新闻 内容 语义 分析 多媒体 智能 方法 | ||
1.一种基于新闻内容语义分析的多媒体智能配图方法,其特征在于包括如下步骤:
S1:提取已有配图新闻的标题,并利用分类器对标题自动进行分类;
S2:根据S1的分类结果,将已有配图新闻的图片进行归类,并由对应的标题生成对已有配图新闻的图片的第一文字描述,然后对所述第一文字描述进行向量化处理,得到第一向量α;
S3:读取未配图新闻的标题和内容,并根据S1的分类结果对未配图新闻的标题进行归类,并根据未配图新闻的标题或内容生成对未配图新闻的第二文字描述,然后对所述第二文字描述进行向量化处理,得到第二向量β;
S4:根据所述第一向量α和所述第二向量β及所述第一文字描述与所述未配图新闻标题或内容相同词的词频确定所述第一文字描述和第二文字描述的匹配度,并根据所述匹配度选出若干张已有配图新闻的图片作为备选图片;
S5:构建背景图片库和风格图片库,将所述备选图片接入语义分割网络,利用输出语义分割结果的掩膜进行基于语义分割的背景切换,得到背景更新图片;
S6:对背景更新图片进行风格迁移和平滑处理。
2.如权利要求1所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,所述S1中分类时分为两类,一类为固定模式配图,一类为可变模式配图。
3.如权利要求1所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,所述S2中按如下方法生成对所述已有配图新闻的图片的第一文字描述:将所述已配图新闻的标题作为所述已配图新闻的图片的初始描述,对于所述已配图新闻的图片相同的所述已配图新闻的标题,取所述已配图新闻的标题的并集作为所述已配图新闻的图片初始描述;根据图片分类结果,对所述已配图新闻的图片的初始描述进行内容提取,生成对所述已有配图新闻的图片的第一文字描述。
4.如权利要求2所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,在所述S3中按如下方法生成对未配图新闻的第二文字描述:若为固定模式配图则使用新闻标题作为所述未配图新闻的初始描述;若为可变模式则使用textrank算法对所述未配图新闻进行摘要提取,同时与所述未配图新闻的标题取并集作为所述未配图新闻的初始描述;然后对所述未配图新闻的初始描述进行内容提取,生成对所述未配图新闻的第二文字描述。
5.如权利要求1所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,在所述S2中,对所述第一文字描述使用预训练bert模型进行向量化得到所述第一向量α,在所述S3中对所述第二文字描述使用预训练bert模型进行向量化得到所述第二向量β,计算所述第一向量α和第二向量β的余弦距离:
再计算所述第一文字描述和第二文字描述相同词的匹配次数:
matches(a,b)=match(a,b)/maxmatch
其中a为从所述第一文字描述中提取的词,b为从所述第二文字描述提取的词,matches(a,b)为a,b中形同词的匹配次数,maxmatch为所有matches(a,b)中的最大值;
再计算所述已配图新闻的图片与所述未配图新闻的匹配度:
l=matches(a,b)-k*dis(α,β);
其中k为系统预设的超参数;
选择所有所述已配图新闻的图片与所述未配图新闻的匹配度中最大值预设区间内的若干张图片作为备选图片。
6.如权利要求1所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,所述S5中,将所述背景库的图片与所述备选图片通过双线性插值的方式放缩至统一尺寸,再对固定背景语义的部分进行切换。
7.如权利要求1所述的基于新闻内容语义分析的多媒体智能配图方法,其特征在于,按如下操作进行所述风格迁移和平滑处理:
训练一个以图像重构为损失函数的自动编码器,将使用自动编码器提取到的特征送入WCT算子进行变换,然后进行解码还原为相应的RGB空间图片;使用gram矩阵定义相似像素的相似风格,然后将风格差异结合像素的相似性矩阵定义出一个目标损失函数,通过优化目标损失最小得到风格统一的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海财联社金融科技有限公司,未经上海财联社金融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110496811.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种瑜伽锻炼身体测评方法及系统
- 下一篇:一种医学术语整合方法及系统
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法