[发明专利]一种学术海报自动排版生成方法有效

专利信息
申请号: 201511016330.0 申请日: 2015-12-29
公开(公告)号: CN105654534B 公开(公告)日: 2018-01-09
发明(设计)人: 郭延文;强玉庭;付彦伟 申请(专利权)人: 南京大学
主分类号: G06T11/60 分类号: G06T11/60;G06F17/24
代理公司: 江苏圣典律师事务所32237 代理人: 胡建华
地址: 210023 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种学术海报自动排版生成方法,包括以下步骤1)学术论文摘要,根据学术论文的不同章节对学术论文进行划分,进而对划分出的不同部分进行摘要;2)面板特征推断,根据每个章节的文字、图片等信息,利用概率图模型学习出学术海报中每个面板的特征,包括大小、形状;3)整体排版,根据机器学习得到的面板特征,自动设计出最适合的面板排版方案;4)局部排版,根据每个面板所应包含的文字和图片,推断每个图片在相应面板中的大小和位置信息;5)生成学术海报,根据前面步骤学习推断得到的信息,先生成latex文件,然后通过WinEdt工具编译生成PDF文件。
搜索关键词: 一种 学术 海报 自动 排版 生成 方法
【主权项】:
一种学术海报自动排版生成方法,其特征在于,包括以下步骤:步骤1,学术论文摘要:读取学术论文的内容,根据学术论文的章节,将学术论文划分为对应的部分,采用自动摘要算法TextRank对学术论文划分后的每个部分自动摘要出文本内容;步骤2,面板特征预测:通过机器学习得出学术论文的每个部分对应的面板信息;步骤3,整体排版:根据机器学习得到的面板信息自动设计出最优的面板排版方案;步骤4,局部排版:根据每个章节的摘要出的文本内容,学习预测出面板内部每个图片在面板内部的位置和大小;步骤5,生成学术海报:根据已经预测出的信息利用latex模板自动生成一个latex文件,然后编译生成学术海报的PDF文件;步骤1包括以下步骤:步骤1‑1,根据学术论文中的k个章节,将学术论文划分为对应的k个部分c1,c2,…,ck,分别对应学术论文的第1章,第2章,…,第k章;步骤1‑2,采用自动摘要算法TextRank对学术论文划分后的每个部分按照一定的比例进行摘要,每个部分ci的摘要为其所包含文字和图片摘要总和,i取值为1,2,…,k;步骤2,包括以下步骤:步骤2‑1,统计学术论文的每个部分文字占学术论文全部摘要的文字的比例t,和学术论文的每个部分图片占学术论文全部摘要的图片的比例q;步骤2‑2,在给定文字比例t和图片比例q时,采用如下公式计算学术论文的每个部分对应的面板大小s的条件概率p(s|t,q)和长宽比r的条件概率p(r|t,q):p(s|t,q)=N(s;ws*[t,q,1]T,σs2),p(r|t,q)=N(r;wr*[t,q,1]T,σr2),其中N表示高斯分布,即:其中ws,σs,wr和σr表示待求解的参数,求解得到的ws和wr为三维的行向量,e表示自然常数;步骤2‑3,根据训练集,利用最大似然估计求解出参数ws、σs、wr和σr分别取何值时使得如下概率函数p(s,r|t,q)最大:p(s,r|t,q)=p(s|t,q)p(r|t,q);步骤2‑4,根据步骤2‑3中求出的参数:ws、σs、wr和σr,将学术论文的每个部分对应的文字比例t和图片比例q代入到步骤中2‑3所述的公式中,求出学术论文的每个部分对应的面板大小s和面板长宽比r,正态分布时,s=wr*[t,q,1]T,r=wr*[t,q,1]T时概率最大;步骤3包括以下步骤:步骤3‑1,学术论文的每个部分c1,c2,…,ck对应一个面板,k个面板记为面板集合:{(s1,r1),(s2,r2),…,(sk,rk)},sk表示由步骤2估计出的第k个面板的大小,rk表示第k个面板的长宽比,学术海报页面宽记为w,高度记为h,则整体排版问题转化为两个子问题:第一个子问题为将面板集合前i个面板,即{(s1,r1),(s2,r2),…,(si,ri)}排版在宽为w*ρ,高为h,或宽为w高为h*ρ的页面上;第二个子问题为将面板后k‑i个面板,即{(si+1,ri+1),(si+2,ri+2),…,(sk,rk)}排版在宽为w*(1‑ρ)高为h,或宽为w*ρ,高为h的页面上;其中ρ表示前i个面板占据的比例,i取值为1,2,…,k;步骤3‑2,对每个子问题使用递归的方式求解;步骤3‑3,当递归到面板集合中只有1个面板时,直接将该面板铺满在规定了长和宽的页面上;步骤3‑4,根据步骤3‑1中i的不同取值,步骤3‑1至步骤3‑3得到两个以上的面板排版方案,在这些排版方案中选择损失函数最小的解,其中损失函数L定义如下:其中ri′为经过整体排版后第i个面板的长宽比;步骤4包括以下步骤:步骤4‑1,对于面板p,根据步骤1中提取内容得到每个面板内的文字量lp,根据步骤2能够估计出面板大小sp,面板的长宽比rp,在面板内部,对于图片g,本身的信息包括图片的大小sg和图片的长宽比rg;需要预测的信息为图片的缩放比μg以及图片在面板内的位置hg,其中图片在面板内的位置hg的取值范围为1,2,3,分别表示图片靠左放置,居中放置,靠右放置;步骤4‑2,在给定步骤4‑1每个面板内的文字量lp,面板大小sp,面板的长宽比rp,面板内图片的大小sg和图片的长宽比rg的情况下,通过下式计算图片的缩放比μg的条件概率p(μg|lp,sp,sg):由于图片在面板内的位置hg是离散变量,其概率分布p(hg|rp,sg,rg)定义为softmax函数:其中wμ、σu和wh表示待求解的参数,whi表示参数wh的第i行,whj表示参数wh的第j行,H=3;步骤4‑3,根据训练集,求解出参数wμ、σu和wh分别取何值时使得如下概率函数最大:p(μg,hg|rp,sg,rg)=p(μg|lp,sp,sg)*p(hg|rp,sg,rg);步骤4‑4,根据步骤4‑3中求出的参数:wμ、σu和wh,对于每个面板,将该面板对应的面板内的文字量lp、面板大小sp、面板的长宽比rp、面板内图片的大小sg和图片的长宽比rg,代入到步骤4‑3中 所述的公式中,采用最大似然估计采样方法,计算出对应的图片大小和位置,并且在采样求解的过程中去掉产生相互遮挡的解;步骤5包括:根据步骤4预测得到的数据,将latex模板中的面板位置、大小填到相应的位置,然后利用WinEdt工具直接将latex文件编译转换为PDF文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201511016330.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top