[发明专利]一种标题图文生成方法及计算设备在审
申请号: | 202010377312.X | 申请日: | 2020-05-07 |
公开(公告)号: | CN111680482A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 廖卫平;胡阿沛;杨卉;陈泽龙 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/295;G06T11/60 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 孟玉洁;谢建云 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标题 图文 生成 方法 计算 设备 | ||
1.一种标题图文生成方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个标题模板、多个图像及其所属的类别、以及用户标签与插槽类型和图像类别的对应关系,其中,每个所述标题模板包括至少一个待填充内容的插槽,所述方法包括:
获取文章内容及其目标用户群的标签;
从所述文章内容中提取出关键词,每个所述关键词对应于至少一种插槽;
从已存储的多个标题模板中筛选出至少一个候选模板,所述候选模板中包括分别与每一个所述标签对应的插槽;
从所述至少一个候选模板中选择一个作为目标模板,将相应的关键词填充至所述目标模板的插槽中,以生成标题文本;以及
从已存储的多个图像中筛选出至少一个候选图像,所述候选图像的类别对应于至少一个所述标签;
从所述至少一个候选图像中选择一个作为标题图像。
2.如权利要求1所述的方法,其中,数据存储装置中存储的多个标题模板按照以下步骤生成:
将点击率大于预设阈值或点击率最大的多个标题作为高点击标题;
基于预设的插槽类型对高点击标题进行命名实体识别,确定其中插槽的位置和类型从而生成标题模板。
3.如权利要求1或2所述的方法,其中,所述从所述文章内容中提取出关键词的步骤包括:
基于预设的插槽类型对所述文章内容进行命名实体识别,以识别出对应于不同插槽类型的文本内容,并将所述文本内容作为关键词。
4.如权利要求1-3中任一项所述的方法,其中,所述从所述至少一个候选模板中选择一个作为目标模板的步骤包括:
从所述至少一个候选模板中随机选择一个作为目标模板。
5.如权利要求1-4中任一项所述的方法,其中,图像的类别按照以下步骤确定:
将已标注类别的图像作为训练样本,训练分类模型;
采用训练好的分类模型来确定待分类的图像的类别。
6.如权利要求1-5中任一项所述方法,其中,所述数据存储装置中还存储有每个图像的质量得分,所述从所述至少一个候选图像中选择一个作为标题图像的步骤包括:
从质量得分最高的多个候选图像中随机选择一个作为标题图像。
7.如权利要求6所述的方法,其中,图像的质量得分按照以下步骤确定:
分别确定图像的色彩丰富度和美感度;
将色彩丰富度与美感度的加权求和结果作为图像的质量得分。
8.如权利要求7所述的方法,其中,图像的色彩丰富度C按照以下公式计算:
C=δrgyb+0.3*μrgyb
其中,
rg=R-G
R、G、B分别为图像的R、G、B颜色通道图,rg、yb分别为第一特征图、第二特征图,δrg、μrg分别为第一特征图中各像素值的标准差和均值,δyb、μyb分别为第二特征图中各像素值的标准差和均值。
9.一种计算设备,包括:
至少一个处理器和存储有程序指令的存储器;
当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述的标题图文生成方法。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-8中任一项所述的标题图文生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010377312.X/1.html,转载请声明来源钻瓜专利网。