[发明专利]法规文件花脸稿的生成方法、生成系统及相关设备有效

专利信息
申请号: 202310401971.6 申请日: 2023-04-17
公开(公告)号: CN116136839B 公开(公告)日: 2023-06-23
发明(设计)人: 刘跃华;杨帆;刘梓韵 申请(专利权)人: 湖南正宇软件技术开发有限公司
主分类号: G06F16/18 分类号: G06F16/18;G06F40/166;G06F40/194;G06F40/216;G06F40/284;G06Q50/18;G06F16/16
代理公司: 深圳市特讯知识产权代理事务所(普通合伙) 44653 代理人: 孟智广
地址: 410000 湖南省长沙市长沙高新开发区*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 法规 文件 花脸 生成 方法 系统 相关 设备
【说明书】:

发明提供了一种法规文件花脸稿的生成方法、生成系统及相关设备,本发明首先基于法规文件结构对需要对比的法规文件进行拆分,之后利用余弦相似度算法找出两份法规文件中的对应的文本,再利用尼德曼‑翁施算法比较对应文本获取得到每个字符的状态以及生成花脸稿的底稿文本,最后利用文本编辑器基于每个字符的状态渲染底稿文本得到花脸稿。本发明采用本了合适的软件算法代替人工,将法规文件花脸稿生成的整个流程做成智能自动化的,用户仅需要上传两篇需比对的法规文件就能一键生成花脸稿,减少了人工和时间成本,最大程度的解决了以前传统人工方式产生的问题。

技术领域

本发明涉及文件处理技术领域,尤其涉及一种法规文件花脸稿的生成方法、生成系统及相关设备。

背景技术

一般来讲,一篇法规文件的颁布需要经过起草→一审→二审→三审等流程,在流程中会出现许多个版本的法规稿件,立法机关的工作人员想要看到不同版本稿件的异同,修改前后的稿件做了哪些修改,传统的方式是通过人工在原稿件上操作word手动标识修改的地方,这种传统的人工标定方式需要损耗大量的人工和时间成本,对工作人员的操作要求也较高,不利于立法工作的进程推进。

因此,现有技术还有待于改进和发展。

发明内容

本发明的主要目的在于解决现有技术所存在背景技术中所提到的技术问题。

本发明第一方面提供了一种法规文件花脸稿的生成方法,所述法规文件花脸稿的生成方法包括以下步骤:

接收用户上传的版本一法规文件和版本二法规文件;

对所述版本一法规文件和所述版本二法规文件进行层级拆分,分别获得版本一层级文本集合和版本二层级文本集合;

基于余弦相似度对所述版本一层级文本集合和所述版本二层级文本集合进行逐层文本比对,找出所述版本一层级文本集合和所述版本二层级文本集合之间的文本映射关系;

基于尼德曼-翁施算法对所述版本一层级文本集合和所述版本二层级文本集合各层级的文本进行比对,记录每个字符的状态、位置以及出现的次数;

基于所述版本一层级文本集合和所述版本二层级文本集合各层级文本中每个所述字符的状态、位置以及出现的次数生成各层级的组合文本;

对各层级的所述组合文本按照所述版本一法规文件和所述版本二法规文件中更新日期最新的版本进行排序操作,获得底稿文本;

利用文本编辑器将所述底稿文本中的各个所述字符渲染成适配的状态样式,得到花脸稿。

在本发明第一方面一种可选的实施方式中,所述基于余弦相似度对所述版本一层级文本集合和所述版本二层级文本集合进行逐层文本比对,找出所述版本一层级文本集合和所述版本二层级文本集合之间的文本映射关系包括:

对于所述版本一层级文本集合和所述版本二层级文本集合的同层级文本,从所述版本一层级文本集合中获取得到待对比文本一,从所述版本二层级文本集合中获取得到待对比文本二;

对于所述待对比文本一进行分词处理,获得待对比文本一词集以及所述待对比文本一词集中各词的词频,并基于所述待对比文本一词集中各词的词频构建得到所述待对比文本一的词向量表示;

对于所述待对比文本二进行分词处理,获得待对比文本二词集以及所述待对比文本二词集中各词的词频,并基于所述待对比文本二词集中各词的词频构建得到所述待对比文本二的词向量表示;

基于所述待对比文本一的词向量表示和所述待对比文本二的词向量表示并通过余弦相似度计算公式获得所述待对比文本一和所述待对比文本二的相似度;

基于所述相似度找出所述版本一层级文本集合和所述版本二层级文本集合中的对应文本组合和独立文本,建立所述对应文本组合之间的映射关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南正宇软件技术开发有限公司,未经湖南正宇软件技术开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310401971.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top