[发明专利]一种版式文件自动成文的方法及系统有效
申请号: | 200810227302.7 | 申请日: | 2008-11-26 |
公开(公告)号: | CN101441621A | 公开(公告)日: | 2009-05-27 |
发明(设计)人: | 徐剑波;董宁;王辉 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 郭润湘 |
地址: | 100871北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种版式文件中自动成文的方法及系统,用于进行文字块的自动类型识别,还原版面文章的引题,标题,副题以及正文等信息,本发明提供的自动成文方法包括:从文字块集合{S}中筛选出标题块集合{T},根据所述标题块集合{T}得到文章集合{A};从文字块集合{S}中获取与文章集合{A}中匹配的文字块,设置为文章正文;获取文章集合{A}中的每篇文章,设置所述文章的其他组成信息。采用本发明,可以提高标引人员的工作效率,节省数据加工成本。 | ||
搜索关键词: | 一种 版式 文件 自动 成文 方法 系统 | ||
【主权项】:
1、一种版式文件自动成文的方法,其特征在于,该方法包括:A:从文字块集合{S}中筛选出标题块集合{T},根据所述标题块集合{T}得到文章集合{A};B:从文字块集合{S}中获取与文章集合{A}中匹配的文字块,设置为文章正文;C:获取文章集合{A}中的每篇文章,设置所述文章的其他组成信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司,未经北大方正集团有限公司;北京方正阿帕比技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810227302.7/,转载请声明来源钻瓜专利网。